StyleGAN3

StyleGAN3 er en generativ adversarial netværksarkitektur til billedgenerering, der forbedrer translation- og rotationsækvarians ved at eliminere aliasing i netværket.

Kort fortalt

StyleGAN3 er en avanceret AI-model, der kan generere realistiske billeder, og som især er god til at håndtere, at motiver flytter sig eller roterer uden at skabe artefakter.

Kategori
model
Niveau
øvet
Udtale
/ˈstaɪlɡæn θriː/

Betydninger

1
  1. 1

    En specifik generativ adversarial netværksarkitektur udviklet af NVIDIA, der fokuserer på at opnå alias-fri billedsyntese med translation- og rotationsækvarians.

    • StyleGAN3 overgår tidligere modeller i at bevare objektidentitet ved rotation og forskydning.Karras et al., 2021
    • Med StyleGAN3 kan man generere videoer med jævne overgange, fordi modellen er ækvivariant over for geometriske transformationer.Karras et al., 2021

Hvornår bruges det

StyleGAN3 bruges primært i forskning og kreative applikationer, hvor der er behov for højkvalitets billedgenerering med geometrisk invarians. Det anvendes bl.a. til syntese af ansigter, landskaber og objekter, samt til dataaugmentering i træning af andre modeller.

Kodeeksempel

import torch
from stylegan3 import StyleGAN3

# Load pretrained model
model = StyleGAN3.from_pretrained('stylegan3-r-ffhq-1024x1024.pkl')

# Generate a random latent vector
z = torch.randn(1, 512)

# Generate image
img = model(z, truncation_psi=0.7)

# Save image
from PIL import Image
Image.fromarray((img[0].clamp(-1,1).permute(1,2,0).cpu().numpy()*127.5+127.5).astype('uint8')).save('output.png')

Eksempel på indlæsning af en fortrænet StyleGAN3-model og generering af et billede.

Oprindelse

StyleGAN3 blev introduceret af forskere hos NVIDIA i 2021 som en videreudvikling af StyleGAN2-serien. Navnet 'StyleGAN' refererer til brugen af stilvektorer (style vectors) til at kontrollere genereringen, og '3' angiver den tredje generation.

Afledte ord

1

Kilder

1