bias-mitigationsteknik
Teknikker til at reducere eller eliminere skævheder i kunstig intelligens, typisk opdelt i præ-processing, in-processing og post-processing metoder.
Kort fortalt
Metoder der bruges til at gøre AI-modeller mere retfærdige ved at mindske systematiske skævheder i data eller algoritmer.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
3- 1
Metoder der ændrer træningsdata for at fjerne skævheder før modeltræning, eksempelvis omvægtning eller fjernelse af sensitive attributter.
- Præ-processing bias-mitigationsteknikker som omvægtning kan anvendes for at sikre, at datasættet er repræsentativt på tværs af demografiske grupper.
- 2
Metoder der integrerer fairness-begrænsninger direkte i modeltræningsalgoritmen, fx adversarial debiasing eller regularisering.
- In-processing bias-mitigationsteknikker som adversarial debiasing kan reducere korrelationen mellem forudsigelser og beskyttede attributter.
- 3
Metoder der justerer modeloutput efter træning for at opfylde fairness-kriterier, fx tærskeljustering eller kalibrering.
- Post-processing bias-mitigationsteknikker kan anvendes uden at genoptrene modellen, hvilket er praktisk i produktionsmiljøer.
Hvornår bruges det
Bias-mitigationsteknikker anvendes når man opdager utilsigtet diskrimination i en model, fx i ansættelses- eller kreditbeslutninger. De implementeres ofte som en del af en fairness-evaluering og kan involvere omvægtning af data, regularisering eller efterbehandling af forudsigelser.
Kodeeksempel
from aif360.algorithms.preprocessing import Reweighing
from aif360.datasets import BinaryLabelDataset
# Assuming dataset with protected attribute 'sex'
tr = BinaryLabelDataset(...)
rw = Reweighing(unprivileged_groups=[{'sex': 0}], privileged_groups=[{'sex': 1}])
tr_transformed = rw.fit_transform(tr)Eksempel på præ-processing bias-mitigation med Reweighing fra AIF360-biblioteket. Metoden tildeler vægte til hver instans for at opnå demografisk paritet.
Oprindelse
Sammensat af engelsk 'bias' (skævhed) og 'mitigation' (afbødning) samt 'teknik'.
Afledte ord
3Kilder
1- Fairness and Machine Learning: Limitations and Opportunities (Barocas, Hardt, Narayanan)