overgeneralisering
Overgeneralisering betegner en models tendens til at lære for brede eller forkerte mønstre, hvilket fører til dårlig præstation på nye data.
Kort fortalt
En model generaliserer for meget og tror, at alt ligner det, den har set før – selv når det ikke gør det.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
I maskinlæring: en models fejlagtige antagelse om at mønstre set i træningsdata gælder universelt, hvilket resulterer i dårlig generalisering til nye data.
- Modellen overgeneraliserede ved at antage, at alle katte er orange, fordi den kun så orange katte under træning.
Hvornår bruges det
Overgeneralisering opstår typisk når en model trænes på et datasæt med for lidt variation eller for mange tilfældige sammenhænge. Det kan ses i både klassificerings- og sprogmodeller, hvor modellen laver for brede antagelser om inputdata.
Oprindelse
Sammensat af 'over-' (for meget) og 'generalisering' (at drage almene slutninger).
Kilder
1- The Elements of Statistical Learning: Data Mining, Inference, and Prediction