datasæt-bias

Systematisk skævhed i et datasæt, der fører til partiske eller urimelige forudsigelser i en AI-model.

Kort fortalt

Hvis dit datasæt hovedsageligt indeholder billeder af hvide mænd, vil din ansigtsgenkendelse være dårligere til at genkende kvinder og personer med mørkere hud.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Systematisk skævhed i et datasæt, der kan føre til en AI-model, som favoriserer visse grupper eller resultater på bekostning af andre, ofte på grund af ubalancer i dataindsamlingen eller historiske fordomme.

    • Modellen viste høj fejlrate for minoritetsgrupper på grund af datasæt-bias, da træningsdata primært kom fra en homogen population.Forskningsartikel, 2023

Hvornår bruges det

Datasæt-bias opstår når træningsdata ikke repræsenterer den virkelige verden bredt nok, ofte på grund af skæv indsamling. Det resulterer i modeller, der forstærker eksisterende uligheder. For at afbøde det anvendes teknikker som rebalancering, augmentering og fairness-metrics.

Oprindelse

Sammensat af 'datasæt' og 'bias' (fra engelsk). Bias kommer fra oldfransk 'biais' med betydningen 'skrå, skæv'. I statistik bruges det om systematisk afvigelse.

Kilder

2
  • A Survey on Bias and Fairness in Machine Learning
  • Fairness and Machine Learning: Limitations and Opportunities