eval-resultat

Et eval-resultat er den samlede vurdering af en models ydeevne baseret på et sæt metrikker, såsom nøjagtighed, præcision eller recall.

Kort fortalt

Kort fortalt er et eval-resultat det tal eller den rapport du får, når du tester hvor god en AI-model er til en given opgave.

Kategori
begreb
Niveau
begynder

Betydninger

1
  1. 1

    Den samlede fremstilling af en models ydeevne i form af en eller flere metrikker, opnået ved at anvende modellen på et testdatasæt.

    • Eval-resultatet for klassifikationsmodellen viste en nøjagtighed på 94 % og en F1-score på 0,92.
    • Efter finjusteringen blev eval-resultatet forbedret markant på tværs af alle metrikker.

Hvornår bruges det

Eval-resultater bruges til at sammenligne forskellige modeller eller versioner af samme model. De rapporteres typisk i forbindelse med modeltræning, benchmarktests eller deployering. Resultaterne kan være enkle tal (fx nøjagtighed) eller mere detaljerede tabeller med metrikker.

Oprindelse

'Eval' er en forkortelse for 'evaluering' (fra engelsk 'evaluation'), og 'resultat' kommer fra latin 'resultatum' (det der følger).