image augmentation
Teknik til at øge mangfoldigheden af træningsdata ved at anvende tilfældige, men realistiske transformationer på eksisterende billeder.
Kort fortalt
Image augmentation skaber flere variationer af dine billeder (f.eks. spejling, rotation) så din model bliver mere robust og ikke overfitter.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
1- 1
Praksis med at anvende tilfældige geometriske og fotometriske transformationer på træningsbilleder for at øge datasættets størrelse og variation, hvilket reducerer overfitting og forbedrer modelrobusthed.
- Ved at anvende image augmentation med rotation og horisontal spejling opnåede vi en 5% forbedring i klassifikationsnøjagtighed.
Hvornår bruges det
Bruges under træning af neurale netværk til billedgenkendelse, objektdetektion og segmentering. Transformationer som rotation, skalering, farvejustering og tilføjelse af støj forbedrer generaliseringsevnen.
Kodeeksempel
from torchvision import transforms
train_transform = transforms.Compose([
transforms.RandomHorizontalFlip(p=0.5),
transforms.RandomRotation(degrees=10),
transforms.ColorJitter(brightness=0.2, contrast=0.2),
transforms.ToTensor(),
])
dataset = torchvision.datasets.CIFAR10(root='./data', train=True, transform=train_transform)Eksempel på image augmentation pipeline i PyTorch: tilfældig spejling, rotation og farvejustering.
Oprindelse
Engelsk 'augmentation' fra latin 'augmentare' (forøge). I billedbehandling betegner det at kunstigt forøge datasættet.
Afledte ord
3Kilder
1- Image Augmentation for Deep Learning: A Survey