VQ-VAE-2
forkortelse for Vector Quantized Variational Autoencoder 2
VQ-VAE-2 er en hierarkisk udgave af VQ-VAE, der bruger flere niveauer af kvantiserede latente repræsentationer og autoregressive priors for at generere højkvalitetsbilleder.
Kort fortalt
En avanceret billedgenereringsmodel, der opdeler det latente rum i flere skalaer og bruger autoregressive modeller til at generere detaljerede billeder.
- Kategori
- arkitektur
- Niveau
- øvet
Betydninger
1- 1
VQ-VAE-2 er en neural netværksarkitektur til generativ modellering, der kombinerer vektorkvantisering med hierarkiske latente repræsentationer og autoregressive priors for at producere højkvalitetsbilleder.
- VQ-VAE-2 opnår state-of-the-art resultater på ImageNet-datasættet. — Razavi et al., 2019
- Den hierarkiske struktur i VQ-VAE-2 muliggør generering af billeder i høj opløsning.
Hvornår bruges det
VQ-VAE-2 bruges primært inden for billedgenerering, især når der kræves høj opløsning og detaljerigdom. Den anvendes ofte i forskning som en baseline for generative modeller og er grundlaget for senere modeller som DALL-E.
Oprindelse
VQ-VAE-2 blev introduceret af Razavi et al. i 2019 som en forbedring af VQ-VAE, med tilføjelse af hierarkisk latente koder og autoregressive priors.