implicit bias

Implicit bias refererer til systematiske skævheder i en AI-models output, der ikke er bevidst indprogrammeret, men som opstår fra skævheder i træningsdata, modelarkitektur eller træningsproces.

Kort fortalt

Når en AI-model lærer fordomme eller stereotyper fra de data, den trænes på, uden at nogen bevidst har tilføjet dem.

Kategori: begreb
Niveau: øvet
Udtale: /ɪmˈplɪsɪt ˈbaɪəs/

Betydninger

1
Den utilsigtede og ofte ubevidste skævhed, som en AI-model lærer fra træningsdata, og som afspejler samfundsmæssige stereotyper eller strukturelle uligheder.
- Sprogmodeller som GPT-3 kan udvise implicit bias ved at associere bestemte roller eller egenskaber med køn eller etnicitet. — Forskningsartikel, 2020
- Ansigtsgenkendelsessystemer har vist implicit bias i form af højere fejlrate for personer med mørkere hudfarve. — Buolamwini & Gebru, 2018

Hvornår bruges det

Begrebet bruges til at analysere og adressere utilsigtede skævheder i maskinlæringsmodeller, især inden for sprogmodeller, ansigtsgenkendelse og beslutningssystemer. Det anvendes i fairness-forskning og ved udvikling af afbødningsteknikker.

Oprindelse

'Implicit' kommer fra latin 'implicitus' (sammenflettet, underforstået), og 'bias' fra oldgræsk 'epíkoiros' (skæv, partisk). Dansk: 'implicit skævhed'.

Afledte ord

implicit bias-afbødning implicit bias-fælden

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →