eval-måling
En eval-måling er en kvantitativ målestok, der bruges til at vurdere en AI-models præstation på en specifik opgave.
Kort fortalt
En eval-måling er et tal, der fortæller, hvor god en AI-model er til noget bestemt, fx om den ofte gætter rigtigt.
- Kategori
- metrik
- Niveau
- begynder
Betydninger
1- 1
En specifik matematisk eller statistisk målestok, der kvantificerer en models præstation på en given opgave.
- Til klassifikationsopgaver er nøjagtighed den mest almindelige eval-måling. — Eget eksempel
- Ved ubalancerede datasæt bør man vælge en eval-måling som F1-score i stedet for nøjagtighed. — Eget eksempel
Hvornår bruges det
Eval-målinger bruges under modeludvikling til at sammenligne forskellige modeller eller versioner, samt til at overvåge ydeevne i produktion. Valget af måling afhænger af opgavetypen (klassifikation, regression osv.) og forretningsmålet.
Oprindelse
Sammensat af 'eval' (forkortelse for evaluation) og 'måling', lånt fra engelsk 'evaluation metric'.