testdatasæt

Et testdatasæt er en samling data, der bruges til at evaluere en maskinlæringsmodel efter træning, for at vurdere dens generaliseringsevne på nye, usete data.

Kategori
begreb
Niveau
begynder

Betydninger

1
  1. 1

    En samling data, der udelukkende bruges til at evaluere en maskinlæringsmodel efter endt træning, for at måle dens præstation på nye, ikke tidligere sete data. Testdatasættet må ikke have været brugt i træning eller validering for at undgå overtilpasning.

    • Det er afgørende at adskille trænings-, validerings- og testdatasættene for at få en retvisende evaluering.
    • Testdatasættet indeholder 10.000 annoterede billeder til klassifikationsopgaven.

Oprindelse

Termen er en oversættelse af det engelske 'test dataset', hvor 'test' betyder at afprøve og 'datasæt' betyder en samling data.