træningsdatasæt

Et træningsdatasæt er en samling af data, der bruges til at træne en maskinlæringsmodel ved at justere dens parametre.

Kort fortalt

Det er det datasæt, du fodrer en AI-model med, så den kan lære mønstre og træffe beslutninger.

Kategori
begreb
Niveau
begynder
Udtale
ˈtʁɛːnɪŋsˌdæːtɑsɛt

Betydninger

1
  1. 1

    Den primære samling af eksempler (input-output-par eller ustrukturerede data), der anvendes til at optimere parametrene i en maskinlæringsmodel gennem en læringsalgoritme.

    • Modellen blev trænet på et træningsdatasæt med en million annoterede billeder.
    • Et godt træningsdatasæt skal dække variationen i den virkelige verden for at undgå overfitting.

Hvornår bruges det

Træningsdatasættet anvendes i den superviserede, uovervågede eller forstærkede læringsfase. Det skal være repræsentativt og balanceret for at undgå bias. Størrelsen og kvaliteten af datasættet har direkte indflydelse på modellens præstation.

Oprindelse

Sammensat af 'træning' (processen at lære) og 'datasæt' (samling af data).

Afledte ord

2

Kilder

1
  • Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning.