generalization error

Generalization error er den forventede fejl på nye, usete data, målt på testfordelingen.

Kort fortalt

Kort fortalt: Generalization error er, hvor godt en model klarer sig på data, den ikke har set før.

Kategori: begreb
Niveau: øvet
Udtale: /ˌdʒɛn.ə.rə.laɪˈzeɪ.ʃən ˈɛr.ər/

Betydninger

1
Den forventede forskel mellem modellens forudsigelser og de sande værdier for data fra den sande fordeling.
- En models generalization error estimeres typisk ved hjælp af en testmængde.
- Målet med træning er at minimere generalization error, ikke kun træningsfejlen.
2
Generalization error kan dekomponeres i bias, varians og støj, hvilket giver indsigt i forskellige fejlkilder.
- Bias-varians-dekompositionen af generalization error hjælper med at forstå overfitting og underfitting.

Hvornår bruges det

Generalization error bruges til at vurdere en models evne til at generalisere fra træningsdata til nye data. Det er centralt i modelvalg og hyperparameterjustering, da en lav træningsfejl ikke nødvendigvis betyder lav generalization error.

Formel

Generalization error = E_{(x,y) \sim P}[L(y, \hat{f}(x))]

Oprindelse

Fra engelsk 'generalization' (fra latin generalis) og 'error' (fra latin error). Begrebet opstod i statistik og maskinlæring i midten af det 20. århundrede.

Afledte ord

generalization gap

Kilder

The Elements of Statistical Learning
Deep Learning

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →