træningssæt
Et træningssæt er en samling af dataeksempler, der bruges til at træne en maskinlæringsmodel.
Kort fortalt
Et træningssæt er det datasæt, som en AI-model lærer fra, ligesom en elev læser lærebøger.
- Kategori
- begreb
- Niveau
- begynder
Betydninger
1- 1
Et datasæt, der anvendes til at træne en maskinlæringsmodel, bestående af eksempler med kendte udfald (labels) i supervised learning eller blot input i unsupervised learning.
- For at træne en billedklassifikator indsamlede vi 10.000 mærkede billeder som træningssæt.
- Træningssættet opdeles ofte i batches for at optimere hukommelsesforbruget.
Hvornår bruges det
Træningssættet anvendes i supervised learning, hvor modellen tilpasser sine parametre for at minimere en tabsfunktion. Det består typisk af input-output-par, og kvaliteten af træningssættet er afgørende for modellens ydeevne.
Kodeeksempel
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)Opdeling af datasæt i træningssæt (80%) og test-sæt (20%) med scikit-learn.
Oprindelse
Sammensat af 'træning' (fra oldnordisk 'træna', at øve) og 'sæt' (fra oldnordisk 'set', mængde).