ELBO-decomposition
forkortelse for Evidence Lower Bound decomposition
Opdeling af ELBO (Evidence Lower Bound) i komponenter, typisk rekonstruktionsterm og KL-divergens, for at forstå og optimere variational inference-modeller.
Kort fortalt
ELBO-dekomposition er en måde at dele bevisets nedre grænse op i mindre dele, så man kan se, hvad der påvirker modellens læring.
- Kategori
- begreb
- Niveau
- ekspert
Betydninger
1- 1
Opdelingen af ELBO i en rekonstruktionsterm, der måler, hvor godt modellen rekonstruerer data, og en regulariseringsterm (KL-divergens), der sikrer, at den latente fordeling ligger tæt på prior.
- ELBO-dekompositionen i en VAE viser, at rekonstruktionstabet alene ikke er tilstrækkeligt til at træne en god generativ model.
- Ved at analysere ELBO-dekompositionen kan man identificere, om modellen overfokuserer på rekonstruktion eller regularisering.
Hvornår bruges det
Bruges i variational autoencoders (VAE'er) til at adskille rekonstruktionstab og regularisering, og i mere avancerede probabilistiske modeller for at analysere og forbedre læringen.
Formel
ELBO = E_q(z|x)[log p(x|z)] - KL(q(z|x) || p(z))Kodeeksempel
def elbo_decomposition(x, z_mean, z_log_var, decoder):
# Reconstruction term
recon = tf.reduce_sum(x * tf.math.log(decoder(z_mean)) + (1-x)*tf.math.log(1-decoder(z_mean)), axis=1)
# KL divergence term
kl = -0.5 * tf.reduce_sum(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var), axis=1)
return recon - klEksempel på ELBO-dekomposition i en VAE med binære data og en Gaussisk latent fordeling.
Oprindelse
ELBO står for 'Evidence Lower Bound', dekomposition betyder opdeling. Begrebet stammer fra variational inference i maskinlæring.
Kilder
2- Auto-Encoding Variational Bayes (Kingma & Welling, 2013)
- Pattern Recognition and Machine Learning (Bishop, 2006)