labeled data
Labeled data er data, hvor hvert eksempel er mærket med den korrekte outputværdi til brug for træning af overvågede maskinlæringsmodeller.
Kort fortalt
Labeled data er data, der har fået en 'facitliste' – det er information, der allerede er kategoriseret eller tagget, så en maskine kan lære af den.
- Kategori
- begreb
- Niveau
- begynder
Betydninger
1- 1
Data, hvor hver observation er forsynet med en etiket (label), der angiver den sande eller ønskede outputværdi, typisk anvendt til træning af overvågede maskinlæringsalgoritmer.
- Til at træne en billedklassifikator har vi brug for tusindvis af labeled data, hvor hvert billede er mærket med den korrekte kategori.
- Labeled data er ofte dyrere at producere end unlabeled data, fordi det kræver manuel annotering.
Hvornår bruges det
Labeled data er afgørende for supervised learning. Det bruges til at træne modeller i alt fra billedgenkendelse til spamfiltrering. Jo mere labeled data af høj kvalitet, desto bedre bliver modellen typisk.
Oprindelse
Fra engelsk 'labeled' (mærket) og 'data' (data). Begrebet opstod med fremkomsten af maskinlæring og behovet for at adskille mærkede data fra umærkede.
Afledte ord
2Kilder
1- Bishop, C. M. (2006). Pattern Recognition and Machine Learning.