implicit bias-afbødning
Implicit bias-afbødning er processen med at reducere utilsigtede skævheder i AI-modellers adfærd, som opstår fra underliggende stereotyper eller skæve træningsdata.
Kort fortalt
Det handler om at gøre AI-modeller mere retfærdige ved at fjerne skjulte fordomme, der kan føre til diskrimination.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Teknikker og metoder til at identificere og reducere implicitte skævheder i AI-systemer, der kan føre til uretfærdige eller diskriminerende udfald.
- For at sikre retfærdighed i ansættelsesalgoritmer anvendes implicit bias-afbødning gennem rebalancering af træningsdata.
- Forskning viser, at implicit bias-afbødning kan forbedre modellers generalisering på tværs af demografiske grupper.
Hvornår bruges det
Implicit bias-afbødning anvendes typisk under modeltræning eller eftertræning, fx gennem datarebalancering, adversariel debiasing eller fair repræsentationer. Det er særligt relevant i følsomme domæner som ansættelse, strafferetspleje og sundhedsvæsen.
Oprindelse
Udtrykket 'implicit bias' stammer fra socialpsykologien og beskriver ubevidste holdninger. 'Afbødning' betyder at reducere eller mildne en skade. Sammen betegner det tekniske tiltag for at mindske ubevidste skævheder i AI.
Kilder
2- Fairness and Abstraction in Sociotechnical Systems (2019)
- Preventing Fairness Gerrymandering (2018)