generaliseringsgab
Forskellen mellem en models præstation på træningsdata og på hidtil usete data.
Kort fortalt
Hvor meget værre en model klarer sig på nye data sammenlignet med dem den blev trænet på.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /ɡenəʁalizeʁiŋsˈɡæˀb/
Betydninger
1- 1
Forskellen mellem en maskinlæringsmodels præstation på træningsdata og på validerings- eller testdata, typisk målt i fejlrate eller nøjagtighed.
- Modellens generaliseringsgab var på 5 procentpoint, hvilket indikerer let overfitting.
- Et stort generaliseringsgab er et tegn på, at modellen har memoreret træningsdata frem for at lære generelle mønstre.
Hvornår bruges det
Generaliseringsgab bruges til at diagnosticere overfitting og vurdere en models evne til at generalisere. Jo større gabet er, desto mere har modellen tilpasset sig støj eller specifikke mønstre i træningsdataene.
Formel
Generaliseringsgab = Træningsfejl − Testfejl (eller test-nøjagtighed − træningsnøjagtighed)Oprindelse
Sammensat af 'generalisering' (evnen til at anvende viden på nye situationer) og 'gab' (forskel), lånt fra engelsk 'generalization gap'.
Kilder
2- The Elements of Statistical Learning (Hastie et al., 2009)
- Deep Learning (Goodfellow et al., 2016)