bias-mitigationsteknik

Teknikker til at reducere eller eliminere skævheder i kunstig intelligens, typisk opdelt i præ-processing, in-processing og post-processing metoder.

Kort fortalt

Metoder der bruges til at gøre AI-modeller mere retfærdige ved at mindske systematiske skævheder i data eller algoritmer.

Kategori
teknik
Niveau
øvet

Betydninger

3
  1. 1

    Metoder der ændrer træningsdata for at fjerne skævheder før modeltræning, eksempelvis omvægtning eller fjernelse af sensitive attributter.

    • Præ-processing bias-mitigationsteknikker som omvægtning kan anvendes for at sikre, at datasættet er repræsentativt på tværs af demografiske grupper.
  2. 2

    Metoder der integrerer fairness-begrænsninger direkte i modeltræningsalgoritmen, fx adversarial debiasing eller regularisering.

    • In-processing bias-mitigationsteknikker som adversarial debiasing kan reducere korrelationen mellem forudsigelser og beskyttede attributter.
  3. 3

    Metoder der justerer modeloutput efter træning for at opfylde fairness-kriterier, fx tærskeljustering eller kalibrering.

    • Post-processing bias-mitigationsteknikker kan anvendes uden at genoptrene modellen, hvilket er praktisk i produktionsmiljøer.

Hvornår bruges det

Bias-mitigationsteknikker anvendes når man opdager utilsigtet diskrimination i en model, fx i ansættelses- eller kreditbeslutninger. De implementeres ofte som en del af en fairness-evaluering og kan involvere omvægtning af data, regularisering eller efterbehandling af forudsigelser.

Kodeeksempel

from aif360.algorithms.preprocessing import Reweighing
from aif360.datasets import BinaryLabelDataset

# Assuming dataset with protected attribute 'sex'
tr = BinaryLabelDataset(...)
rw = Reweighing(unprivileged_groups=[{'sex': 0}], privileged_groups=[{'sex': 1}])
tr_transformed = rw.fit_transform(tr)

Eksempel på præ-processing bias-mitigation med Reweighing fra AIF360-biblioteket. Metoden tildeler vægte til hver instans for at opnå demografisk paritet.

Oprindelse

Sammensat af engelsk 'bias' (skævhed) og 'mitigation' (afbødning) samt 'teknik'.

Afledte ord

3

Kilder

1
  • Fairness and Machine Learning: Limitations and Opportunities (Barocas, Hardt, Narayanan)