image augmentation

Teknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.

Kort fortalt

Image augmentation skaber flere variationer af dine billeder (f.eks. spejling, rotation) så din model bliver mere robust og ikke overfitter.

Kategori
teknik
Niveau
begynder

Betydninger

1
  1. 1

    Praksis med at anvende tilfældige geometriske og fotometriske transformationer på træningsbilleder for at øge datasættets størrelse og variation, hvilket reducerer overfitting og forbedrer modelrobusthed.

    • Ved at anvende image augmentation med rotation og horisontal spejling opnåede vi en 5% forbedring i klassifikationsnøjagtighed.

Hvornår bruges det

Bruges under træning af neurale netværk til billedgenkendelse, objektdetektion og segmentering. Transformationer som rotation, skalering, farvejustering og tilføjelse af støj forbedrer generaliseringsevnen.

Kodeeksempel

from torchvision import transforms

train_transform = transforms.Compose([
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.RandomRotation(degrees=10),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
    transforms.ToTensor(),
])

dataset = torchvision.datasets.CIFAR10(root='./data', train=True, transform=train_transform)

Eksempel på image augmentation pipeline i PyTorch: tilfældig spejling, rotation og farvejustering.

Oprindelse

Engelsk 'augmentation' fra latin 'augmentare' (forøge). I billedbehandling betegner det at kunstigt forøge datasættet.

Afledte ord

3

Kilder

1
  • Image Augmentation for Deep Learning: A Survey