implicit bias

Implicit bias refererer til systematiske skævheder i en AI-models output, der ikke er bevidst indprogrammeret, men som opstår fra skævheder i træningsdata, modelarkitektur eller træningsproces.

Kort fortalt

Når en AI-model lærer fordomme eller stereotyper fra de data, den trænes på, uden at nogen bevidst har tilføjet dem.

Kategori
begreb
Niveau
øvet
Udtale
/ɪmˈplɪsɪt ˈbaɪəs/

Betydninger

1
  1. 1

    Den utilsigtede og ofte ubevidste skævhed, som en AI-model lærer fra træningsdata, og som afspejler samfundsmæssige stereotyper eller strukturelle uligheder.

    • Sprogmodeller som GPT-3 kan udvise implicit bias ved at associere bestemte roller eller egenskaber med køn eller etnicitet.Forskningsartikel, 2020
    • Ansigtsgenkendelsessystemer har vist implicit bias i form af højere fejlrate for personer med mørkere hudfarve.Buolamwini & Gebru, 2018

Hvornår bruges det

Begrebet bruges til at analysere og adressere utilsigtede skævheder i maskinlæringsmodeller, især inden for sprogmodeller, ansigtsgenkendelse og beslutningssystemer. Det anvendes i fairness-forskning og ved udvikling af afbødningsteknikker.

Oprindelse

'Implicit' kommer fra latin 'implicitus' (sammenflettet, underforstået), og 'bias' fra oldgræsk 'epíkoiros' (skæv, partisk). Dansk: 'implicit skævhed'.

Afledte ord

2

Kilder

3