dVAE

forkortelse for discrete Variational Autoencoder

En dVAE (discrete Variational Autoencoder) er en type variational autoencoder, der kortlægger kontinuerte inputdata til et diskret latent repræsentationsrum via kvantisering.

Kort fortalt

Kort fortalt: dVAE er en model, der komprimerer data som billeder til en række diskrete tokens – lidt som at lave en mosaik af enkeltbrikker.

Kategori
model
Niveau
øvet
Udtale
/diː viː eɪ iː/

Betydninger

1
  1. 1

    En variational autoencoder der anvender vektorkvantisering for at kortlægge inddata til diskrete latente repræsentationer (tokens) via en lært kodebog.

    • DALL·E anvender en dVAE til at konvertere billeder til en sekvens af diskrete koder, som transformeren kan modellere.Ramesh et al., 'Zero-Shot Text-to-Image Generation', 2021
    • dVAE-modellen består af en encoder, en decoder og en kodebog med diskrete embeddings.

Hvornår bruges det

dVAE anvendes primært i generative modeller, f.eks. DALL·E, til at tokenisere billeder inden en transformer behandler dem. Modellen lærer en kodebog med diskrete latente variable, som muliggør effektiv repræsentation og generering.

Oprindelse

Akronymet dVAE står for 'discrete Variational Autoencoder' – en variant af variational autoencoder (VAE) der anvender diskret latente variable frem for kontinuerte.

Afledte ord

2

Kilder

2