StyleGAN

StyleGAN er en type GAN med en stilbaseret generator, der muliggør kontrol over forskellige aspekter af det genererede billede ved at manipulere latente variabler.

Kort fortalt

En GAN-arkitektur, der giver ekstremt realistisk og kontrollerbar billedgenerering ved at adskille 'stil' og 'indhold'.

Kategori
arkitektur
Niveau
øvet
Udtale
/ˈstaɪlˌɡæn/

Betydninger

1
  1. 1

    En generativ adversarial network (GAN)-arkitektur, hvor generatoren bruger et stilbaseret design, der muliggør kontrol af fine og grove træk i outputtet gennem skalerede latente koder, samt teknikker som stilmiks og trunkering.

    • StyleGAN kan generere fotorealistiske billeder af ansigter med uovertruffen variation i alder, køn og ansigtsudtryk.Karras et al., 2018
    • Ved at manipulere stilvektorerne i StyleGAN kan man kontrollere både globale aspekter som belysning og lokale detaljer som hårfarve.Karras et al., 2019

Hvornår bruges det

StyleGAN bruges typisk til at generere højkvalitetsbilleder af ansigter, dyr, objekter eller kunst. Den anvendes også i dataaugmentation, kreativt designs og forskning i generative modeller.

Kodeeksempel

import torch
from stylegan2_pytorch import StyleGAN2

model = StyleGAN2.load('pretrained.pt')
z = torch.randn(1, 512)
img = model.G(z)

Simpelt eksempel på brug af en forudtrænet StyleGAN-model til at generere et billede fra en tilfældig latent vektor.

Oprindelse

Introduceret i 2018 af NVIDIA-forskere (Karras et al.) i artiklen 'A Style-Based Generator Architecture for Generative Adversarial Networks'.

Afledte ord

3

Kilder

2