Stable Diffusion XL
forkortelse for SDXL
En avanceret latent diffusionsmodel til tekst-til-billede-generering, udviklet af Stability AI, der producerer billeder i høj opløsning med forbedret detaljegrad og komposition sammenlignet med forgængeren.
Kort fortalt
Stable Diffusion XL er en AI-model, der kan skabe detaljerede billeder ud fra tekstbeskrivelser, og den er bedre end den originale Stable Diffusion.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /ˈsteɪbəl dɪˈfjuːʒən ɛks ˈɛl/
Betydninger
1- 1
En latent diffusionsmodel med 3,5 milliarder parametre, bestående af to sammenkædede modeller: en base-model til 1024x1024 pixel billeder og en refiner-model til forbedring af detaljer.
- Stable Diffusion XL kan generere billeder i 1024x1024 opløsning med betydeligt færre artefakter end den originale Stable Diffusion. — Stability AI blog, 2023
- Ved at bruge SDXL's refiner-model kan man opnå en højere grad af fotorealisme i ansigter og teksturer. — forskningsartikel, 2023
Hvornår bruges det
SDXL bruges primært til billedgenerering i kreative værktøjer, ofte via Hugging Face Diffusers-biblioteket eller via API'er. Den anvendes til at skabe illustrationer, konceptkunst og fotorealistiske billeder, og den kræver en GPU med mindst 8 GB VRAM til fuld opløsning.
Kodeeksempel
from diffusers import StableDiffusionXLPipeline
import torch
pipe = StableDiffusionXLPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0",
torch_dtype=torch.float16
).to("cuda")
prompt = "A futuristic cityscape at sunset, digital art"
image = pipe(prompt).images[0]
image.save("sdxl_output.png")Brug af Hugging Face Diffusers til at indlæse SDXL og generere et billede.
Oprindelse
Navnet 'Stable Diffusion XL' kommer fra forgængeren Stable Diffusion, hvor 'XL' står for 'Extra Large', hvilket refererer til den større modelarkitektur og højere opløsning.