DDIM

forkortelse for Denoising Diffusion Implicit Models

DDIM er en klasse af diffusionsmodeller der muliggør deterministisk og hurtig sampling ved at omgå Markov-kæde-antagelsen.

Kort fortalt

DDIM er en metode til at generere billeder hurtigere fra en diffusionsmodel ved at tage kortere veje i nedbrydningsprocessen.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En klasse af implicitte diffusionsmodeller der generaliserer den oprindelige DDPM ved at tillade ikke-Markovske fremadrettede processer, hvilket muliggør deterministisk sampling med færre trin.

    • DDIM opnår højkvalitets billedgenerering med kun 50 samplingstrin, sammenlignet med DDPM's 1000.Song et al., 2020
    • Ved at bruge DDIM kan man udføre inversion af et billede tilbage til latent rum med høj præcision.

Hvornår bruges det

DDIM bruges til hurtig sampling i diffusionsmodeller, især når man ønsker deterministiske og reproducerbare resultater. Det er særligt anvendeligt i billedgenerering og inversionsopgaver.

Kodeeksempel

def ddim_step(x_t, t, model, alpha_bar, sigma):
    # Predict noise
    eps_pred = model(x_t, t)
    # Compute predicted x_0
    x_0_pred = (x_t - (1 - alpha_bar[t]).sqrt() * eps_pred) / alpha_bar[t].sqrt()
    # Sample x_{t-1} using DDIM
    x_t_minus_1 = alpha_bar[t-1].sqrt() * x_0_pred + sigma * eps_pred
    return x_t_minus_1

Et enkelt DDIM-samplingstrin, der beregner den forudsagte støj og springer til et tidligere tidstrin.

Oprindelse

Introduceret af Song et al. i 2020 som en forbedring af den klassiske diffusionsproces.

Kilder

1