evalueringsmetrik

En evalueringsmetrik er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.

Kort fortalt

En evalueringsmetrik fortæller, hvor godt en AI-model klarer sig, som når man tæller, hvor mange svar der er rigtige i en test.

Kategori: metrik
Niveau: begynder
Udtale: [evaluˈeˀɐ̯eŋsmeˌtˢʁ̥ik]

Betydninger

1
En kvantitativ størrelse, der objektivt måler en models præstation på en specifik opgave, ofte baseret på sammenligning mellem forudsigelser og sande værdier.
- Nøjagtighed er en almindelig evalueringsmetrik for klassifikationsmodeller, men den kan være misvisende ved ubalancerede datasæt.
- For regressionsmodeller er gennemsnitlig kvadratfejl (MSE) en populær evalueringsmetrik, der straffer store afvigelser hårdere.

Hvornår bruges det

Evalueringsmetrikker bruges til at sammenligne modeller, finjustere hyperparametre og validere under træning. Valget af metrik afhænger af problemtypen; for klassifikation bruges ofte nøjagtighed, præcision og F1-score, mens regression ofte bruger gennemsnitlig kvadratfejl (MSE) eller R².

Oprindelse

Sammensat af 'evaluering' (vurdering) og 'metrik' (måling), fra græsk 'metron' (mål).

Kilder

Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i metrik →Tilfældigt opslag →