augmenteringspipeline

En augmenteringspipeline er en række automatiserede transformationer anvendt på træningsdata for at øge datasættets variation og forbedre modelgeneralisation.

Kort fortalt

En augmenteringspipeline er en samling af datatransformationer, der gør træningsdata mere varieret og hjælper modellen med at generalisere bedre.

Kategori
teknik
Niveau
øvet
Udtale
[ɑwɡmɛnˈteˀʁeŋspiplajn]

Betydninger

2
  1. 1

    En række af transformationer, der anvendes sekventielt på et inputdatapunkt for at producere en augmenteret version med henblik på at forbedre modeltræning.

    • Augmenteringspipelinen for billeder omfattede rotation, beskæring og farvejustering.
  2. 2

    Den tekniske implementering af en sådan række af transformationer, ofte som en modulær kæde i et machine learning framework.

    • Vi brugte torchvision.transforms.Compose til at definere augmenteringspipelinen.

Hvornår bruges det

Augmenteringspipelines bruges typisk i computer vision og NLP under træning for at skabe syntetiske variationer af eksisterende data. De anvendes ofte i forbindelse med dataindlæsning og er en standardkomponent i moderne deep learning frameworks.

Kodeeksempel

from torchvision import transforms

augmentation_pipeline = transforms.Compose([
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.RandomRotation(10),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
    transforms.ToTensor(),
])

Eksempel på en augmenteringspipeline i PyTorch, der tilfældigt spejlvender, roterer og justerer farver på billeder under træning.

Oprindelse

Sammensat af 'augmentering' (fra engelsk 'augmentation') og 'pipeline' (rørledning), hentet fra engelsk 'data augmentation pipeline'.

Afledte ord

1

Kilder

1
  • ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)