testdatasæt
Et testdatasæt er en mængde data, der bruges til at evaluere en trænet models ydeevne på hidtil usete data.
Kort fortalt
Et testdatasæt er en samling eksempler, man bruger til at tjekke, hvor godt en model klarer sig på nye data, den ikke har set før.
- Kategori
- begreb
- Niveau
- begynder
- Udtale
- /ˈtɛstˌdɑːtɑsɛt/
Betydninger
1- 1
En samling data, der udelukkende anvendes til slut-evaluering af en maskinlæringsmodel efter endt træning og validering.
- Modellens nøjagtighed på testdatasættet var 94 %, hvilket indikerer en god generalisering.
- For at undgå datalækage må testdatasættet ikke berøres under modeludviklingen.
Hvornår bruges det
I maskinlæring adskilles testdatasættet fra trænings- og valideringsdata for at give en upartisk vurdering. Det bruges kun én gang efter modellen er færdigudviklet, fx til at rapportere en endelig fejlrate eller nøjagtighed.
Oprindelse
Sammensat af 'test' (fra engelsk test) og 'datasæt' (dansk for dataset). Begrebet stammer fra statistik og maskinlæring, hvor opdeling i trænings-, validerings- og testdatasæt er standardpraksis.