Data labeling

Processen med at tilføje metadata (labels) til rådata for at gøre dem anvendelige til træning af overvågede maskinlæringsmodeller.

Kort fortalt

Data labeling er opgaven med at mærke data – f.eks. at skrive, hvad der er på et billede – så en AI kan lære at genkende mønstre.

Kategori
teknik
Niveau
begynder

Betydninger

1
  1. 1

    Handlingen med at tildele etiketter eller tags til rådata, såsom billeder, tekst eller lyd, for at skabe træningsdata til overvågede maskinlæringsmodeller.

    • Virksomheden outsourcer data labeling til en tredjepart for at opbygge et træningssæt til ansigtsgenkendelse.
    • Data labeling er den mest arbejdskrævende del af maskinlæringspipelinen.

Hvornår bruges det

Data labeling anvendes i hele AI-branchen til at skabe træningsdata. Det er ofte en manuel, tidskrævende og dyr proces, men afgørende for modelpræstation. Moderne tilgange inkluderer semi-supervised learning og active learning for at reducere mængden af manuel labeling.

Oprindelse

Udtrykket 'data labeling' kommer fra engelsk 'data labeling' (eller 'data labelling' i britisk engelsk), hvor 'label' betyder mærkat eller etiket. Begrebet opstod i forbindelse med overvåget maskinlæring i 1990'erne.

Afledte ord

3