Overfitting
Overfitting opstår når en model lærer støj og tilfældigheder i træningsdata, så den generaliserer dårligt til nye data.
Kort fortalt
Overfitting er når en model husker træningsdata for godt i stedet for at lære de bagvedliggende mønstre.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- ˌoʊvərˈfɪtɪŋ
Betydninger
1- 1
En tilstand i maskinlæring hvor en statistisk model beskriver tilfældig støj eller tilfældigheder i stedet for den underliggende relation. Modellen har høj varians og generaliserer dårligt.
- Modellen havde 99% nøjagtighed på træningssættet men kun 60% på testsættet, hvilket er et klassisk tegn på overfitting.
- For at undgå overfitting anvender vi ofte L2-regularisering i træningsprocessen.
Hvornår bruges det
Overfitting er et centralt problem i maskinlæring. Det opstår typisk når modellen er for kompleks i forhold til datamængden, eller når den trænes for længe. Man bekæmper det med regularisering, early stopping, dropout og mere data.
Oprindelse
Udtrykket 'overfitting' kommer af engelsk 'over' (for meget) og 'fit' (tilpasse), altså at modellen tilpasser sig for meget til træningsdata.
Afledte ord
1Kilder
1- The Elements of Statistical Learning (2nd ed.)