FGSM

forkortelse for Fast Gradient Sign Method

FGSM er et hurtigt gradientbaseret angreb, der genererer adversarial examples ved at tilføje støj i retning af gradientens fortegn.

Kort fortalt

FGSM er en simpel måde at narre en AI-model til at tage fejl ved at tilføje lidt støj til billedet, som er usynligt for mennesker, men som får modellen til at klassificere forkert.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    FGSM er en teknik til at generere adversarial examples ved at tilføje støj i retningen af gradienten af tabfunktionen med hensyn til input.

    • FGSM bruges til at teste robustheden af neurale netværk.Goodfellow et al., 2014

Hvornår bruges det

FGSM bruges typisk til at evaluere robustheden af neurale netværk ved at teste, om små perturbationer kan ændre modellens output. Det er en referencemetode inden for adversarial robustness.

Formel

x_adv = x + ε · sign(∇_x J(θ, x, y))

Kodeeksempel

import torch
def fgsm_attack(image, epsilon, data_grad):
    sign_data_grad = data_grad.sign()
    perturbed_image = image + epsilon * sign_data_grad
    return perturbed_image

PyTorch-implementering af FGSM-angreb.

Oprindelse

Introduceret af Goodfellow et al. i 2014.

Afledte ord

1

Kilder

1