eval-måling

Proces eller metode til at kvantificere en AI-models ydeevne ved hjælp af standardiserede metrikker.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Handlingen eller processen med at anvende en række metrikker (f.eks. præcision, recall, BLEU, perplexity) for at vurdere en AI-models præstation på en given opgave, ofte på en testdatasæt.

    • Eval-måling af sprogmodellen viste en BLEU-score på 0,85.faglig praksis
    • Vi udførte en grundig eval-måling på tværs af flere benchmarks.faglig praksis

Kodeeksempel

from sklearn.metrics import accuracy_score

y_true = [0, 1, 0, 1]
y_pred = [0, 1, 1, 1]
acc = accuracy_score(y_true, y_pred)
print(f'Accuracy: {acc}')

Eksempel på en simpel eval-måling af nøjagtighed ved hjælp af sklearn.

Oprindelse

Sammensat af 'eval' (afkortning af evaluation) og 'måling', efter engelsk 'evaluation measurement'.

Afledte ord

2