eval-måling
Proces eller metode til at kvantificere en AI-models ydeevne ved hjælp af standardiserede metrikker.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Handlingen eller processen med at anvende en række metrikker (f.eks. præcision, recall, BLEU, perplexity) for at vurdere en AI-models præstation på en given opgave, ofte på en testdatasæt.
- Eval-måling af sprogmodellen viste en BLEU-score på 0,85. — faglig praksis
- Vi udførte en grundig eval-måling på tværs af flere benchmarks. — faglig praksis
Kodeeksempel
from sklearn.metrics import accuracy_score
y_true = [0, 1, 0, 1]
y_pred = [0, 1, 1, 1]
acc = accuracy_score(y_true, y_pred)
print(f'Accuracy: {acc}')Eksempel på en simpel eval-måling af nøjagtighed ved hjælp af sklearn.
Oprindelse
Sammensat af 'eval' (afkortning af evaluation) og 'måling', efter engelsk 'evaluation measurement'.