generaliseringsgab

Forskellen mellem en models præstation på træningsdata og på hidtil usete data.

Kort fortalt

Hvor meget værre en model klarer sig på nye data sammenlignet med dem den blev trænet på.

Kategori
begreb
Niveau
øvet
Udtale
/ɡenəʁalizeʁiŋsˈɡæˀb/

Betydninger

1
  1. 1

    Forskellen mellem en maskinlæringsmodels præstation på træningsdata og på validerings- eller testdata, typisk målt i fejlrate eller nøjagtighed.

    • Modellens generaliseringsgab var på 5 procentpoint, hvilket indikerer let overfitting.
    • Et stort generaliseringsgab er et tegn på, at modellen har memoreret træningsdata frem for at lære generelle mønstre.

Hvornår bruges det

Generaliseringsgab bruges til at diagnosticere overfitting og vurdere en models evne til at generalisere. Jo større gabet er, desto mere har modellen tilpasset sig støj eller specifikke mønstre i træningsdataene.

Formel

Generaliseringsgab = Træningsfejl − Testfejl (eller test-nøjagtighed − træningsnøjagtighed)

Oprindelse

Sammensat af 'generalisering' (evnen til at anvende viden på nye situationer) og 'gab' (forskel), lånt fra engelsk 'generalization gap'.

Kilder

2
  • The Elements of Statistical Learning (Hastie et al., 2009)
  • Deep Learning (Goodfellow et al., 2016)