Stable Diffusion XL

forkortelse for SDXL

En avanceret latent diffusionsmodel til tekst-til-billede-generering, udviklet af Stability AI, der producerer billeder i høj opløsning med forbedret detaljegrad og komposition sammenlignet med forgængeren.

Kort fortalt

Stable Diffusion XL er en AI-model, der kan skabe detaljerede billeder ud fra tekstbeskrivelser, og den er bedre end den originale Stable Diffusion.

Kategori
model
Niveau
øvet
Udtale
/ˈsteɪbəl dɪˈfjuːʒən ɛks ˈɛl/

Betydninger

1
  1. 1

    En latent diffusionsmodel med 3,5 milliarder parametre, bestående af to sammenkædede modeller: en base-model til 1024x1024 pixel billeder og en refiner-model til forbedring af detaljer.

    • Stable Diffusion XL kan generere billeder i 1024x1024 opløsning med betydeligt færre artefakter end den originale Stable Diffusion.Stability AI blog, 2023
    • Ved at bruge SDXL's refiner-model kan man opnå en højere grad af fotorealisme i ansigter og teksturer.forskningsartikel, 2023

Hvornår bruges det

SDXL bruges primært til billedgenerering i kreative værktøjer, ofte via Hugging Face Diffusers-biblioteket eller via API'er. Den anvendes til at skabe illustrationer, konceptkunst og fotorealistiske billeder, og den kræver en GPU med mindst 8 GB VRAM til fuld opløsning.

Kodeeksempel

from diffusers import StableDiffusionXLPipeline
import torch

pipe = StableDiffusionXLPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    torch_dtype=torch.float16
).to("cuda")

prompt = "A futuristic cityscape at sunset, digital art"
image = pipe(prompt).images[0]
image.save("sdxl_output.png")

Brug af Hugging Face Diffusers til at indlæse SDXL og generere et billede.

Oprindelse

Navnet 'Stable Diffusion XL' kommer fra forgængeren Stable Diffusion, hvor 'XL' står for 'Extra Large', hvilket refererer til den større modelarkitektur og højere opløsning.

Afledte ord

2

Kilder

2