evalueringsmetrik
En evalueringsmetrik er en kvantitativ måling, der bruges til at vurdere en models præstation på en given opgave.
Kort fortalt
En evalueringsmetrik fortæller, hvor godt en AI-model klarer sig, som når man tæller, hvor mange svar der er rigtige i en test.
- Kategori
- metrik
- Niveau
- begynder
- Udtale
- [evaluˈeˀɐ̯eŋsmeˌtˢʁ̥ik]
Betydninger
1- 1
En kvantitativ størrelse, der objektivt måler en models præstation på en specifik opgave, ofte baseret på sammenligning mellem forudsigelser og sande værdier.
- Nøjagtighed er en almindelig evalueringsmetrik for klassifikationsmodeller, men den kan være misvisende ved ubalancerede datasæt.
- For regressionsmodeller er gennemsnitlig kvadratfejl (MSE) en populær evalueringsmetrik, der straffer store afvigelser hårdere.
Hvornår bruges det
Evalueringsmetrikker bruges til at sammenligne modeller, finjustere hyperparametre og validere under træning. Valget af metrik afhænger af problemtypen; for klassifikation bruges ofte nøjagtighed, præcision og F1-score, mens regression ofte bruger gennemsnitlig kvadratfejl (MSE) eller R².
Oprindelse
Sammensat af 'evaluering' (vurdering) og 'metrik' (måling), fra græsk 'metron' (mål).
Kilder
2- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
- Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.