generalization error

Generalization error er den forventede fejl på nye, usete data, målt på testfordelingen.

Kort fortalt

Kort fortalt: Generalization error er, hvor godt en model klarer sig på data, den ikke har set før.

Kategori
begreb
Niveau
øvet
Udtale
/ˌdʒɛn.ə.rə.laɪˈzeɪ.ʃən ˈɛr.ər/

Betydninger

2
  1. 1

    Den forventede forskel mellem modellens forudsigelser og de sande værdier for data fra den sande fordeling.

    • En models generalization error estimeres typisk ved hjælp af en testmængde.
    • Målet med træning er at minimere generalization error, ikke kun træningsfejlen.
  2. 2

    Generalization error kan dekomponeres i bias, varians og støj, hvilket giver indsigt i forskellige fejlkilder.

    • Bias-varians-dekompositionen af generalization error hjælper med at forstå overfitting og underfitting.

Hvornår bruges det

Generalization error bruges til at vurdere en models evne til at generalisere fra træningsdata til nye data. Det er centralt i modelvalg og hyperparameterjustering, da en lav træningsfejl ikke nødvendigvis betyder lav generalization error.

Formel

Generalization error = E_{(x,y) \sim P}[L(y, \hat{f}(x))]

Oprindelse

Fra engelsk 'generalization' (fra latin generalis) og 'error' (fra latin error). Begrebet opstod i statistik og maskinlæring i midten af det 20. århundrede.

Afledte ord

1

Kilder

2
  • The Elements of Statistical Learning
  • Deep Learning