WGAN

forkortelse for Wasserstein Generative Adversarial Network

En type generativt adversart netværk, der bruger Wasserstein-afstanden til at stabilisere træning og undgå mode collapse.

Kort fortalt

WGAN forbedrer GAN-træning ved at måle forskellen mellem rigtige og falske billeder med en mere stabil afstandsmetrik.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En forbedring af GAN-arkitekturen, der minimerer Wasserstein-afstanden mellem den virkelige og den genererede fordeling ved hjælp af en critic-funktion, som trænes til at være 1-Lipschitz.

    • WGAN løser problemet med ustabil træning i traditionelle GAN'er ved at bruge Wasserstein-afstanden som tab.Arjovsky et al., 2017
    • I WGAN erstattes diskriminatoren af en critic, der uden sigmoid-aktivering giver en skalar score.

Hvornår bruges det

WGAN bruges til billedgenerering, hvor stabilitet og variationsrigdom er vigtig. I praksis erstattes GAN's diskriminator med en critic, og vægtene klippes (weight clipping) eller straffes med gradient penalty for at opfylde Lipschitz-betingelsen.

Formel

L_critic = E_{x~P_r}[f(x)] - E_{z~P_z}[f(G(z))]; L_gen = E_{z~P_z}[f(G(z))]

Kodeeksempel

def critic_loss(real, fake, critic):
    return torch.mean(critic(fake)) - torch.mean(critic(real))

def gen_loss(fake, critic):
    return -torch.mean(critic(fake))

Kodeeksempel på WGAN-tabsfunktioner: critic-tab og generator-tab.

Oprindelse

Akronym for Wasserstein Generative Adversarial Network, opkaldt efter Wasserstein-afstanden (også kendt som Jorden-Flytter-afstanden), der bruges i stedet for Jensen-Shannon-divergensen.

Afledte ord

1

Kilder

1