eval-måling

En eval-måling er en kvantitativ målestok, der bruges til at vurdere en AI-models præstation på en specifik opgave.

Kort fortalt

En eval-måling er et tal, der fortæller, hvor god en AI-model er til noget bestemt, fx om den ofte gætter rigtigt.

Kategori
metrik
Niveau
begynder

Betydninger

1
  1. 1

    En specifik matematisk eller statistisk målestok, der kvantificerer en models præstation på en given opgave.

    • Til klassifikationsopgaver er nøjagtighed den mest almindelige eval-måling.Eget eksempel
    • Ved ubalancerede datasæt bør man vælge en eval-måling som F1-score i stedet for nøjagtighed.Eget eksempel

Hvornår bruges det

Eval-målinger bruges under modeludvikling til at sammenligne forskellige modeller eller versioner, samt til at overvåge ydeevne i produktion. Valget af måling afhænger af opgavetypen (klassifikation, regression osv.) og forretningsmålet.

Oprindelse

Sammensat af 'eval' (forkortelse for evaluation) og 'måling', lånt fra engelsk 'evaluation metric'.