Overfitting

Overfitting opstår når en model lærer støj og tilfældigheder i træningsdata, så den generaliserer dårligt til nye data.

Kort fortalt

Overfitting er når en model husker træningsdata for godt i stedet for at lære de bagvedliggende mønstre.

Kategori
begreb
Niveau
øvet
Udtale
ˌoʊvərˈfɪtɪŋ

Betydninger

1
  1. 1

    En tilstand i maskinlæring hvor en statistisk model beskriver tilfældig støj eller tilfældigheder i stedet for den underliggende relation. Modellen har høj varians og generaliserer dårligt.

    • Modellen havde 99% nøjagtighed på træningssættet men kun 60% på testsættet, hvilket er et klassisk tegn på overfitting.
    • For at undgå overfitting anvender vi ofte L2-regularisering i træningsprocessen.

Hvornår bruges det

Overfitting er et centralt problem i maskinlæring. Det opstår typisk når modellen er for kompleks i forhold til datamængden, eller når den trænes for længe. Man bekæmper det med regularisering, early stopping, dropout og mere data.

Oprindelse

Udtrykket 'overfitting' kommer af engelsk 'over' (for meget) og 'fit' (tilpasse), altså at modellen tilpasser sig for meget til træningsdata.

Afledte ord

1

Kilder

1
  • The Elements of Statistical Learning (2nd ed.)