datasæt-bias
Systematisk skævhed i et datasæt, der fører til partiske eller urimelige forudsigelser i en AI-model.
Kort fortalt
Hvis dit datasæt hovedsageligt indeholder billeder af hvide mænd, vil din ansigtsgenkendelse være dårligere til at genkende kvinder og personer med mørkere hud.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Systematisk skævhed i et datasæt, der kan føre til en AI-model, som favoriserer visse grupper eller resultater på bekostning af andre, ofte på grund af ubalancer i dataindsamlingen eller historiske fordomme.
- Modellen viste høj fejlrate for minoritetsgrupper på grund af datasæt-bias, da træningsdata primært kom fra en homogen population. — Forskningsartikel, 2023
Hvornår bruges det
Datasæt-bias opstår når træningsdata ikke repræsenterer den virkelige verden bredt nok, ofte på grund af skæv indsamling. Det resulterer i modeller, der forstærker eksisterende uligheder. For at afbøde det anvendes teknikker som rebalancering, augmentering og fairness-metrics.
Oprindelse
Sammensat af 'datasæt' og 'bias' (fra engelsk). Bias kommer fra oldfransk 'biais' med betydningen 'skrå, skæv'. I statistik bruges det om systematisk afvigelse.
Kilder
2- A Survey on Bias and Fairness in Machine Learning
- Fairness and Machine Learning: Limitations and Opportunities