Eval
forkortelse for evaluation
Processen med at vurdere en models ydeevne på et datasæt, typisk ved brug af metrikker som accuracy, precision, recall eller F1-score.
Kort fortalt
Eval er den fase, hvor man tjekker, hvor god en AI-model er til at løse sin opgave – fx ved at måle hvor mange rigtige svar den giver.
- Kategori
- begreb
- Niveau
- begynder
- Udtale
- /iːˈvæl/
Betydninger
2- 1
Processen med at måle en models præstation på et datasæt ved hjælp af relevante metrikker.
- Eval af modellen viste en accuracy på 94% på testdata. — egen konstruktion
- Vi kører eval på valideringssættet efter hver epoke for at følge med i overfitting. — egen konstruktion
- 2
En tilstand i maskinlæringsrammer (fx PyTorch, TensorFlow) hvor modellen skifter til evalueringsmode, hvilket deaktiverer træningsspecifikke lag som dropout og batch-normalisering.
- Inden inferens skal du huske at kalde model.eval() for at få korrekte resultater. — egen konstruktion
Hvornår bruges det
Eval bruges under modeludvikling til at teste ydeevnen efter træning, sammenligne forskellige modeller og validere, at modellen generaliserer til nye data. Det kan også referere til den specifikke tilstand i neurale netværksrammer, hvor dropout og batch-normalisering deaktiveres.
Kodeeksempel
import torch
import torch.nn as nn
model = nn.Sequential(
nn.Linear(10, 5),
nn.Dropout(0.5),
nn.ReLU(),
nn.Linear(5, 2)
)
# Træningstilstand (dropout aktiv)
model.train()
# Evalueringsmode (dropout deaktiveret)
model.eval()
with torch.no_grad():
output = model(torch.randn(1, 10))Eksempel i PyTorch: model.eval() skifter til evalueringstilstand og deaktiverer dropout under inferens.
Oprindelse
Forkortelse af det engelske 'evaluation' (evaluering).