test sæt

Del af et datasæt der holdes adskilt fra træning og validering, og kun bruges til at evaluere modellens endelige ydeevne efter al træning.

Kategori
begreb
Niveau
begynder

Betydninger

1
  1. 1

    En delmængde af data som ikke anvendes under træning eller validering, men udelukkende til at måle modellens generaliseringsevne på nye, usete data. Test sættet må ikke påvirke modelvalg eller hyperparameterjustering, da det ville føre til overfitting.

    • Efter finjustering af hyperparametrene blev modellen evalueret på test sættet.
    • Det er afgørende at test sættet repræsenterer den virkelige datadistribution.

Kodeeksempel

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Opdeling af data i trænings- og test sæt med scikit-learn.

Oprindelse

Fra 'test' (af latin testum) og 'sæt' (delmængde); standardterm i maskinlæring.

Afledte ord

2