træningsdatasæt
Et træningsdatasæt er en samling af data, der bruges til at træne en maskinlæringsmodel ved at justere dens parametre.
Kort fortalt
Det er det datasæt, du fodrer en AI-model med, så den kan lære mønstre og træffe beslutninger.
- Kategori
- begreb
- Niveau
- begynder
- Udtale
- ˈtʁɛːnɪŋsˌdæːtɑsɛt
Betydninger
1- 1
Den primære samling af eksempler (input-output-par eller ustrukturerede data), der anvendes til at optimere parametrene i en maskinlæringsmodel gennem en læringsalgoritme.
- Modellen blev trænet på et træningsdatasæt med en million annoterede billeder.
- Et godt træningsdatasæt skal dække variationen i den virkelige verden for at undgå overfitting.
Hvornår bruges det
Træningsdatasættet anvendes i den superviserede, uovervågede eller forstærkede læringsfase. Det skal være repræsentativt og balanceret for at undgå bias. Størrelsen og kvaliteten af datasættet har direkte indflydelse på modellens præstation.
Oprindelse
Sammensat af 'træning' (processen at lære) og 'datasæt' (samling af data).
Afledte ord
2Kilder
1- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning.