generaliseringsgab

Forskellen mellem en models præstation på træningsdata og på hidtil usete data.

Kort fortalt

Hvor meget værre en model klarer sig på nye data sammenlignet med dem den blev trænet på.

Kategori: begreb
Niveau: øvet
Udtale: /ɡenəʁalizeʁiŋsˈɡæˀb/

Betydninger

1
Forskellen mellem en maskinlæringsmodels præstation på træningsdata og på validerings- eller testdata, typisk målt i fejlrate eller nøjagtighed.
- Modellens generaliseringsgab var på 5 procentpoint, hvilket indikerer let overfitting.
- Et stort generaliseringsgab er et tegn på, at modellen har memoreret træningsdata frem for at lære generelle mønstre.

Hvornår bruges det

Generaliseringsgab bruges til at diagnosticere overfitting og vurdere en models evne til at generalisere. Jo større gabet er, desto mere har modellen tilpasset sig støj eller specifikke mønstre i træningsdataene.

Formel

Generaliseringsgab = Træningsfejl − Testfejl (eller test-nøjagtighed − træningsnøjagtighed)

Oprindelse

Sammensat af 'generalisering' (evnen til at anvende viden på nye situationer) og 'gab' (forskel), lånt fra engelsk 'generalization gap'.

Kilder

The Elements of Statistical Learning (Hastie et al., 2009)
Deep Learning (Goodfellow et al., 2016)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →