generalization gap

Forskellen mellem en models præstation på træningsdata og på hidtil usete testdata.

Kort fortalt

Forskellen på, hvor godt en model klarer sig på de data, den er trænet på, og på nye data – en stor forskel betyder typisk overfitting.

Kategori
begreb
Niveau
øvet
Udtale
/ˌdʒɛnərəlaɪˈzeɪʃən ɡæp/

Betydninger

1
  1. 1

    Forskellen mellem en models præstation på træningsdata og på hidtil usete testdata, ofte udtrykt som en forskel i en metrik som nøjagtighed eller tab.

    • En stor generalization gap på 15 % i nøjagtighed indikerede, at modellen overfittede til træningsdata.Eksempel
    • For at reducere generalization gap anvendes teknikker som regularisering og dropout.Eksempel

Hvornår bruges det

Generalization gap bruges ofte til at diagnosticere overfitting; en stor gap indikerer, at modellen memorerer træningsdata og ikke generaliserer. Det måles typisk som forskel i nøjagtighed, tab eller en anden metrik mellem trænings- og testsæt.

Oprindelse

Begrebet stammer fra statistisk læringsteori og maskinlæring, hvor 'generalization' refererer til evnen til at præstere på nye data, og 'gap' til forskellen mellem træning og test.

Kilder

1
  • Deep Learning (Goodfellow, Bengio, Courville)