implicit bias
Implicit bias refererer til systematiske skævheder i en AI-models output, der ikke er bevidst indprogrammeret, men som opstår fra skævheder i træningsdata, modelarkitektur eller træningsproces.
Kort fortalt
Når en AI-model lærer fordomme eller stereotyper fra de data, den trænes på, uden at nogen bevidst har tilføjet dem.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /ɪmˈplɪsɪt ˈbaɪəs/
Betydninger
1- 1
Den utilsigtede og ofte ubevidste skævhed, som en AI-model lærer fra træningsdata, og som afspejler samfundsmæssige stereotyper eller strukturelle uligheder.
- Sprogmodeller som GPT-3 kan udvise implicit bias ved at associere bestemte roller eller egenskaber med køn eller etnicitet. — Forskningsartikel, 2020
- Ansigtsgenkendelsessystemer har vist implicit bias i form af højere fejlrate for personer med mørkere hudfarve. — Buolamwini & Gebru, 2018
Hvornår bruges det
Begrebet bruges til at analysere og adressere utilsigtede skævheder i maskinlæringsmodeller, især inden for sprogmodeller, ansigtsgenkendelse og beslutningssystemer. Det anvendes i fairness-forskning og ved udvikling af afbødningsteknikker.
Oprindelse
'Implicit' kommer fra latin 'implicitus' (sammenflettet, underforstået), og 'bias' fra oldgræsk 'epíkoiros' (skæv, partisk). Dansk: 'implicit skævhed'.