Wasserstein GAN

En Generative Adversarial Network (GAN), der anvender Wasserstein-afstanden (Earth Mover's Distance) som tabsfunktion for at stabilisere træningen og undgå mode collapse.

Kort fortalt

Wasserstein GAN er en forbedret version af GAN, der gør træningen mere stabil ved at måle afstanden mellem reelle og genererede datasæt på en mere meningsfuld måde end traditionelle GAN'er.

Kategori
arkitektur
Niveau
øvet

Betydninger

1
  1. 1

    En Generative Adversarial Network (GAN), hvor diskriminatoren (critic) trænes til at maksimere Wasserstein-afstanden mellem reelle og genererede data, og generatoren trænes til at minimere denne afstand. Dette giver mere stabile gradienter og reducerer mode collapse.

    • WGAN bruger Earth Mover's Distance (Wasserstein-1) som tabsfunktion.Arjovsky et al., 2017
    • Træning af WGAN kræver ofte weight clipping for at opretholde Lipschitz-betingelsen.Arjovsky et al., 2017

Hvornår bruges det

WGAN bruges typisk i billedgenerering og andre generative opgaver, hvor træningsstabilitet er kritisk. Det reducerer mode collapse og giver en mere kontinuerlig gradient for generatoren. Kræver ofte weight clipping eller gradient penalty (WGAN-GP) for at opretholde Lipschitz-betingelsen.

Formel

W(P_r, P_g) = sup_{||D||_L ≤ 1} (E_{x~P_r}[D(x)] - E_{z~P_z}[D(G(z))])

Kodeeksempel

# Critic loss (maximize Wasserstein distance)
def critic_loss(real_output, fake_output):
    return torch.mean(fake_output) - torch.mean(real_output)

# Generator loss (minimize Wasserstein distance)
def generator_loss(fake_output):
    return -torch.mean(fake_output)

# Note: Critic weights must be clipped or gradient penalty applied to enforce Lipschitz constraint.

Kort eksempel på tabsfunktioner i WGAN med PyTorch-lignende kode. Kritikeren (critic) maksimerer forskellen mellem ægte og genererede outputs, mens generatoren minimerer den negative forventning af de genererede outputs.

Oprindelse

Introduceret af Martin Arjovsky, Soumith Chintala og Léon Bottou i 2017 som en løsning på træningsinstabilitet i originale GAN'er.

Afledte ord

1

Kilder

2
  • Wasserstein GAN (Arjovsky et al., 2017)
  • Improved Training of Wasserstein GANs (Gulrajani et al., 2017)