DDIM
forkortelse for Denoising Diffusion Implicit Models
DDIM er en klasse af diffusionsmodeller der muliggør deterministisk og hurtig sampling ved at omgå Markov-kæde-antagelsen.
Kort fortalt
DDIM er en metode til at generere billeder hurtigere fra en diffusionsmodel ved at tage kortere veje i nedbrydningsprocessen.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En klasse af implicitte diffusionsmodeller der generaliserer den oprindelige DDPM ved at tillade ikke-Markovske fremadrettede processer, hvilket muliggør deterministisk sampling med færre trin.
- DDIM opnår højkvalitets billedgenerering med kun 50 samplingstrin, sammenlignet med DDPM's 1000. — Song et al., 2020
- Ved at bruge DDIM kan man udføre inversion af et billede tilbage til latent rum med høj præcision.
Hvornår bruges det
DDIM bruges til hurtig sampling i diffusionsmodeller, især når man ønsker deterministiske og reproducerbare resultater. Det er særligt anvendeligt i billedgenerering og inversionsopgaver.
Kodeeksempel
def ddim_step(x_t, t, model, alpha_bar, sigma):
# Predict noise
eps_pred = model(x_t, t)
# Compute predicted x_0
x_0_pred = (x_t - (1 - alpha_bar[t]).sqrt() * eps_pred) / alpha_bar[t].sqrt()
# Sample x_{t-1} using DDIM
x_t_minus_1 = alpha_bar[t-1].sqrt() * x_0_pred + sigma * eps_pred
return x_t_minus_1Et enkelt DDIM-samplingstrin, der beregner den forudsagte støj og springer til et tidligere tidstrin.
Oprindelse
Introduceret af Song et al. i 2020 som en forbedring af den klassiske diffusionsproces.