Data labeling
Processen med at tilføje metadata (labels) til rådata for at gøre dem anvendelige til træning af overvågede maskinlæringsmodeller.
Kort fortalt
Data labeling er opgaven med at mærke data – f.eks. at skrive, hvad der er på et billede – så en AI kan lære at genkende mønstre.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
1- 1
Handlingen med at tildele etiketter eller tags til rådata, såsom billeder, tekst eller lyd, for at skabe træningsdata til overvågede maskinlæringsmodeller.
- Virksomheden outsourcer data labeling til en tredjepart for at opbygge et træningssæt til ansigtsgenkendelse.
- Data labeling er den mest arbejdskrævende del af maskinlæringspipelinen.
Hvornår bruges det
Data labeling anvendes i hele AI-branchen til at skabe træningsdata. Det er ofte en manuel, tidskrævende og dyr proces, men afgørende for modelpræstation. Moderne tilgange inkluderer semi-supervised learning og active learning for at reducere mængden af manuel labeling.
Oprindelse
Udtrykket 'data labeling' kommer fra engelsk 'data labeling' (eller 'data labelling' i britisk engelsk), hvor 'label' betyder mærkat eller etiket. Begrebet opstod i forbindelse med overvåget maskinlæring i 1990'erne.