Stable Diffusion

Stable Diffusion er en latent diffusionsmodel, der genererer billeder ud fra tekstbeskrivelser ved at anvende en diffusionsproces i et latent rum.

Kort fortalt

Stable Diffusion er en AI-model, der kan skabe realistiske billeder ud fra en tekstbeskrivelse.

Kategori
model
Niveau
øvet
Udtale
/ˈsteɪbəl dɪˈfjuːʒən/

Betydninger

1
  1. 1

    En latent diffusionsmodel udviklet af CompVis, LMU München og Stability AI, som genererer billeder fra tekstprompts ved at tilføje og fjerne støj i et latent rum.

    • Stable Diffusion revolutionerede tekst-til-billede-generering med sin open source-tilgængelighed og lave hardwarekrav.Stability AI blog, 2022
    • Ved at justere prompten kan Stable Diffusion generere et utal af forskellige billedstile.

Hvornår bruges det

Stable Diffusion bruges bredt til billedgenerering, kunstskabelse, prototyper og forskning. Den kan køres lokalt på almindelig hardware og er open source, hvilket gør den populær blandt udviklere og kunstnere.

Kodeeksempel

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5")
pipe.to("cuda")

image = pipe("A fantasy landscape with dragons").images[0]
image.save("fantasy.png")

Dette eksempel bruger Hugging Face diffusers-bibliotek til at indlæse Stable Diffusion v1.5 og generere et billede ud fra en tekstprompt.

Oprindelse

Navnet 'Stable Diffusion' refererer til den stabile træningsproces og den underliggende diffusionsmodel, hvor 'stable' henviser til modellens robusthed og reproducerbarhed.

Afledte ord

2

Kilder

2