ELBO-decomposition

forkortelse for Evidence Lower Bound decomposition

Opdeling af ELBO (Evidence Lower Bound) i komponenter, typisk rekonstruktionsterm og KL-divergens, for at forstå og optimere variational inference-modeller.

Kort fortalt

ELBO-dekomposition er en måde at dele bevisets nedre grænse op i mindre dele, så man kan se, hvad der påvirker modellens læring.

Kategori: begreb
Niveau: ekspert

Betydninger

1
Opdelingen af ELBO i en rekonstruktionsterm, der måler, hvor godt modellen rekonstruerer data, og en regulariseringsterm (KL-divergens), der sikrer, at den latente fordeling ligger tæt på prior.
- ELBO-dekompositionen i en VAE viser, at rekonstruktionstabet alene ikke er tilstrækkeligt til at træne en god generativ model.
- Ved at analysere ELBO-dekompositionen kan man identificere, om modellen overfokuserer på rekonstruktion eller regularisering.

Hvornår bruges det

Bruges i variational autoencoders (VAE'er) til at adskille rekonstruktionstab og regularisering, og i mere avancerede probabilistiske modeller for at analysere og forbedre læringen.

Formel

ELBO = E_q(z|x)[log p(x|z)] - KL(q(z|x) || p(z))

Kodeeksempel

def elbo_decomposition(x, z_mean, z_log_var, decoder):
    # Reconstruction term
    recon = tf.reduce_sum(x * tf.math.log(decoder(z_mean)) + (1-x)*tf.math.log(1-decoder(z_mean)), axis=1)
    # KL divergence term
    kl = -0.5 * tf.reduce_sum(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var), axis=1)
    return recon - kl

Eksempel på ELBO-dekomposition i en VAE med binære data og en Gaussisk latent fordeling.

Oprindelse

ELBO står for 'Evidence Lower Bound', dekomposition betyder opdeling. Begrebet stammer fra variational inference i maskinlæring.

Kilder

Auto-Encoding Variational Bayes (Kingma & Welling, 2013)
Pattern Recognition and Machine Learning (Bishop, 2006)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →