Stable Diffusion
Stable Diffusion er en latent diffusionsmodel, der genererer billeder ud fra tekstbeskrivelser ved at anvende en diffusionsproces i et latent rum.
Kort fortalt
Stable Diffusion er en AI-model, der kan skabe realistiske billeder ud fra en tekstbeskrivelse.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /ˈsteɪbəl dɪˈfjuːʒən/
Betydninger
1- 1
En latent diffusionsmodel udviklet af CompVis, LMU München og Stability AI, som genererer billeder fra tekstprompts ved at tilføje og fjerne støj i et latent rum.
- Stable Diffusion revolutionerede tekst-til-billede-generering med sin open source-tilgængelighed og lave hardwarekrav. — Stability AI blog, 2022
- Ved at justere prompten kan Stable Diffusion generere et utal af forskellige billedstile.
Hvornår bruges det
Stable Diffusion bruges bredt til billedgenerering, kunstskabelse, prototyper og forskning. Den kan køres lokalt på almindelig hardware og er open source, hvilket gør den populær blandt udviklere og kunstnere.
Kodeeksempel
from diffusers import StableDiffusionPipeline
import torch
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5")
pipe.to("cuda")
image = pipe("A fantasy landscape with dragons").images[0]
image.save("fantasy.png")Dette eksempel bruger Hugging Face diffusers-bibliotek til at indlæse Stable Diffusion v1.5 og generere et billede ud fra en tekstprompt.
Oprindelse
Navnet 'Stable Diffusion' refererer til den stabile træningsproces og den underliggende diffusionsmodel, hvor 'stable' henviser til modellens robusthed og reproducerbarhed.