FGSM
forkortelse for Fast Gradient Sign Method
FGSM er et hurtigt gradientbaseret angreb, der genererer adversarial examples ved at tilføje støj i retning af gradientens fortegn.
Kort fortalt
FGSM er en simpel måde at narre en AI-model til at tage fejl ved at tilføje lidt støj til billedet, som er usynligt for mennesker, men som får modellen til at klassificere forkert.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
FGSM er en teknik til at generere adversarial examples ved at tilføje støj i retningen af gradienten af tabfunktionen med hensyn til input.
- FGSM bruges til at teste robustheden af neurale netværk. — Goodfellow et al., 2014
Hvornår bruges det
FGSM bruges typisk til at evaluere robustheden af neurale netværk ved at teste, om små perturbationer kan ændre modellens output. Det er en referencemetode inden for adversarial robustness.
Formel
x_adv = x + ε · sign(∇_x J(θ, x, y))Kodeeksempel
import torch
def fgsm_attack(image, epsilon, data_grad):
sign_data_grad = data_grad.sign()
perturbed_image = image + epsilon * sign_data_grad
return perturbed_imagePyTorch-implementering af FGSM-angreb.
Oprindelse
Introduceret af Goodfellow et al. i 2014.