diffusionsmodel

En generativ model, der lærer at omvendt en støjtilførselsproces for at generere data fra tilfældig støj.

Kort fortalt

En model, der lærer at skabe nye data (f.eks. billeder) ved at starte med tilfældig støj og gradvist fjerne støjen indtil et realistisk output opstår.

Kategori
model
Niveau
øvet

Betydninger

2
  1. 1

    En klasse af generative sandsynlighedsmodeller, der trænes til at omvendt en markovkæde, som gradvist tilføjer støj til data, indtil det bliver ren støj. Modellen lærer derefter at fjerne støjen trin for trin.

    • Diffusionsmodeller har vist imponerende resultater i billedgenerering, hvor de overgår GANs i mangfoldighed og kvalitet.
  2. 2

    Specifikt en arkitektur baseret på denotationelle diffusionssandsynlighedsmodeller (DDPM) eller scorebaserede modeller, der estimerer gradienten af log-sandsynlighedstætheden (score-funktionen).

    • DDPM-modellen anvender en U-Net-arkitektur til at forudsige støjen på hvert tidstrin.

Hvornår bruges det

Diffusionsmodeller bruges primært til generering af billeder, lyd og video, ofte i værktøjer som Stable Diffusion og DALL-E. De anvendes også til superopløsning, inpainting og lydgenerering. Træning kræver mange data og beregningsressourcer, men inferens er langsommere end GANs.

Kodeeksempel

from diffusers import DDPMPipeline
pipe = DDPMPipeline.from_pretrained("google/ddpm-celebahq-256")
image = pipe().images[0]
image.save("generated.png")

Dette eksempel bruger Hugging Face Diffusers-biblioteket til at indlæse en forudtrænet DDPM-model og generere et billede af et menneskeansigt.

Oprindelse

Begrebet er overtaget fra fysikkens diffusionsprocesser, hvor partikler bevæger sig fra høj til lav koncentration. I maskinlæring henviser det til den gradvise tilføjelse og fjernelse af støj, inspireret af termodynamisk diffusion.

Afledte ord

2

Kilder

2
  • Denoising Diffusion Probabilistic Models (Ho et al., 2020)
  • Generative Modeling by Estimating Gradients of the Data Distribution (Song & Ermon, 2019)