augmenteringspipeline
En augmenteringspipeline er en række automatiserede transformationer anvendt på træningsdata for at øge datasættets variation og forbedre modelgeneralisation.
Kort fortalt
En augmenteringspipeline er en samling af datatransformationer, der gør træningsdata mere varieret og hjælper modellen med at generalisere bedre.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- [ɑwɡmɛnˈteˀʁeŋspiplajn]
Betydninger
2- 1
En række af transformationer, der anvendes sekventielt på et inputdatapunkt for at producere en augmenteret version med henblik på at forbedre modeltræning.
- Augmenteringspipelinen for billeder omfattede rotation, beskæring og farvejustering.
- 2
Den tekniske implementering af en sådan række af transformationer, ofte som en modulær kæde i et machine learning framework.
- Vi brugte torchvision.transforms.Compose til at definere augmenteringspipelinen.
Hvornår bruges det
Augmenteringspipelines bruges typisk i computer vision og NLP under træning for at skabe syntetiske variationer af eksisterende data. De anvendes ofte i forbindelse med dataindlæsning og er en standardkomponent i moderne deep learning frameworks.
Kodeeksempel
from torchvision import transforms
augmentation_pipeline = transforms.Compose([
transforms.RandomHorizontalFlip(p=0.5),
transforms.RandomRotation(10),
transforms.ColorJitter(brightness=0.2, contrast=0.2),
transforms.ToTensor(),
])Eksempel på en augmenteringspipeline i PyTorch, der tilfældigt spejlvender, roterer og justerer farver på billeder under træning.
Oprindelse
Sammensat af 'augmentering' (fra engelsk 'augmentation') og 'pipeline' (rørledning), hentet fra engelsk 'data augmentation pipeline'.
Afledte ord
1Kilder
1- ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)