StyleGAN3
StyleGAN3 er en generativ adversarial netværksarkitektur til billedgenerering, der forbedrer translation- og rotationsækvarians ved at eliminere aliasing i netværket.
Kort fortalt
StyleGAN3 er en avanceret AI-model, der kan generere realistiske billeder, og som især er god til at håndtere, at motiver flytter sig eller roterer uden at skabe artefakter.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /ˈstaɪlɡæn θriː/
Betydninger
1- 1
En specifik generativ adversarial netværksarkitektur udviklet af NVIDIA, der fokuserer på at opnå alias-fri billedsyntese med translation- og rotationsækvarians.
- StyleGAN3 overgår tidligere modeller i at bevare objektidentitet ved rotation og forskydning. — Karras et al., 2021
- Med StyleGAN3 kan man generere videoer med jævne overgange, fordi modellen er ækvivariant over for geometriske transformationer. — Karras et al., 2021
Hvornår bruges det
StyleGAN3 bruges primært i forskning og kreative applikationer, hvor der er behov for højkvalitets billedgenerering med geometrisk invarians. Det anvendes bl.a. til syntese af ansigter, landskaber og objekter, samt til dataaugmentering i træning af andre modeller.
Kodeeksempel
import torch
from stylegan3 import StyleGAN3
# Load pretrained model
model = StyleGAN3.from_pretrained('stylegan3-r-ffhq-1024x1024.pkl')
# Generate a random latent vector
z = torch.randn(1, 512)
# Generate image
img = model(z, truncation_psi=0.7)
# Save image
from PIL import Image
Image.fromarray((img[0].clamp(-1,1).permute(1,2,0).cpu().numpy()*127.5+127.5).astype('uint8')).save('output.png')Eksempel på indlæsning af en fortrænet StyleGAN3-model og generering af et billede.
Oprindelse
StyleGAN3 blev introduceret af forskere hos NVIDIA i 2021 som en videreudvikling af StyleGAN2-serien. Navnet 'StyleGAN' refererer til brugen af stilvektorer (style vectors) til at kontrollere genereringen, og '3' angiver den tredje generation.