generalization gap

Forskellen mellem en models præstation på træningsdata og på hidtil usete testdata.

Kort fortalt

Forskellen på, hvor godt en model klarer sig på de data, den er trænet på, og på nye data – en stor forskel betyder typisk overfitting.

Kategori: begreb
Niveau: øvet
Udtale: /ˌdʒɛnərəlaɪˈzeɪʃən ɡæp/

Betydninger

1
Forskellen mellem en models præstation på træningsdata og på hidtil usete testdata, ofte udtrykt som en forskel i en metrik som nøjagtighed eller tab.
- En stor generalization gap på 15 % i nøjagtighed indikerede, at modellen overfittede til træningsdata. — Eksempel
- For at reducere generalization gap anvendes teknikker som regularisering og dropout. — Eksempel

Hvornår bruges det

Generalization gap bruges ofte til at diagnosticere overfitting; en stor gap indikerer, at modellen memorerer træningsdata og ikke generaliserer. Det måles typisk som forskel i nøjagtighed, tab eller en anden metrik mellem trænings- og testsæt.

Oprindelse

Begrebet stammer fra statistisk læringsteori og maskinlæring, hvor 'generalization' refererer til evnen til at præstere på nye data, og 'gap' til forskellen mellem træning og test.

Kilder

Deep Learning (Goodfellow, Bengio, Courville)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →