træningssæt

Et træningssæt er en samling af dataeksempler, der bruges til at træne en maskinlæringsmodel.

Kort fortalt

Et træningssæt er det datasæt, som en AI-model lærer fra, ligesom en elev læser lærebøger.

Kategori
begreb
Niveau
begynder

Betydninger

1
  1. 1

    Et datasæt, der anvendes til at træne en maskinlæringsmodel, bestående af eksempler med kendte udfald (labels) i supervised learning eller blot input i unsupervised learning.

    • For at træne en billedklassifikator indsamlede vi 10.000 mærkede billeder som træningssæt.
    • Træningssættet opdeles ofte i batches for at optimere hukommelsesforbruget.

Hvornår bruges det

Træningssættet anvendes i supervised learning, hvor modellen tilpasser sine parametre for at minimere en tabsfunktion. Det består typisk af input-output-par, og kvaliteten af træningssættet er afgørende for modellens ydeevne.

Kodeeksempel

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Opdeling af datasæt i træningssæt (80%) og test-sæt (20%) med scikit-learn.

Oprindelse

Sammensat af 'træning' (fra oldnordisk 'træna', at øve) og 'sæt' (fra oldnordisk 'set', mængde).

Afledte ord

2