WGAN
forkortelse for Wasserstein Generative Adversarial Network
En type generativt adversart netværk, der bruger Wasserstein-afstanden til at stabilisere træning og undgå mode collapse.
Kort fortalt
WGAN forbedrer GAN-træning ved at måle forskellen mellem rigtige og falske billeder med en mere stabil afstandsmetrik.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En forbedring af GAN-arkitekturen, der minimerer Wasserstein-afstanden mellem den virkelige og den genererede fordeling ved hjælp af en critic-funktion, som trænes til at være 1-Lipschitz.
- WGAN løser problemet med ustabil træning i traditionelle GAN'er ved at bruge Wasserstein-afstanden som tab. — Arjovsky et al., 2017
- I WGAN erstattes diskriminatoren af en critic, der uden sigmoid-aktivering giver en skalar score.
Hvornår bruges det
WGAN bruges til billedgenerering, hvor stabilitet og variationsrigdom er vigtig. I praksis erstattes GAN's diskriminator med en critic, og vægtene klippes (weight clipping) eller straffes med gradient penalty for at opfylde Lipschitz-betingelsen.
Formel
L_critic = E_{x~P_r}[f(x)] - E_{z~P_z}[f(G(z))]; L_gen = E_{z~P_z}[f(G(z))]Kodeeksempel
def critic_loss(real, fake, critic):
return torch.mean(critic(fake)) - torch.mean(critic(real))
def gen_loss(fake, critic):
return -torch.mean(critic(fake))Kodeeksempel på WGAN-tabsfunktioner: critic-tab og generator-tab.
Oprindelse
Akronym for Wasserstein Generative Adversarial Network, opkaldt efter Wasserstein-afstanden (også kendt som Jorden-Flytter-afstanden), der bruges i stedet for Jensen-Shannon-divergensen.