image augmentation

Teknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.

Kort fortalt

Image augmentation skaber flere variationer af dine billeder (f.eks. spejling, rotation) så din model bliver mere robust og ikke overfitter.

Kategori: teknik
Niveau: begynder

Betydninger

1
Praksis med at anvende tilfældige geometriske og fotometriske transformationer på træningsbilleder for at øge datasættets størrelse og variation, hvilket reducerer overfitting og forbedrer modelrobusthed.
- Ved at anvende image augmentation med rotation og horisontal spejling opnåede vi en 5% forbedring i klassifikationsnøjagtighed.

Hvornår bruges det

Bruges under træning af neurale netværk til billedgenkendelse, objektdetektion og segmentering. Transformationer som rotation, skalering, farvejustering og tilføjelse af støj forbedrer generaliseringsevnen.

Kodeeksempel

from torchvision import transforms

train_transform = transforms.Compose([
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.RandomRotation(degrees=10),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
    transforms.ToTensor(),
])

dataset = torchvision.datasets.CIFAR10(root='./data', train=True, transform=train_transform)

Eksempel på image augmentation pipeline i PyTorch: tilfældig spejling, rotation og farvejustering.

Oprindelse

Engelsk 'augmentation' fra latin 'augmentare' (forøge). I billedbehandling betegner det at kunstigt forøge datasættet.

Afledte ord

online augmentation offline augmentation albumentations

Kilder

Image Augmentation for Deep Learning: A Survey

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →