test sæt
Del af et datasæt der holdes adskilt fra træning og validering, og kun bruges til at evaluere modellens endelige ydeevne efter al træning.
- Kategori
- begreb
- Niveau
- begynder
Betydninger
1- 1
En delmængde af data som ikke anvendes under træning eller validering, men udelukkende til at måle modellens generaliseringsevne på nye, usete data. Test sættet må ikke påvirke modelvalg eller hyperparameterjustering, da det ville føre til overfitting.
- Efter finjustering af hyperparametrene blev modellen evalueret på test sættet.
- Det er afgørende at test sættet repræsenterer den virkelige datadistribution.
Kodeeksempel
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)Opdeling af data i trænings- og test sæt med scikit-learn.
Oprindelse
Fra 'test' (af latin testum) og 'sæt' (delmængde); standardterm i maskinlæring.