interpretabilitetsmetode

En metode til at gøre en maskinlæringsmodel beslutningsproces forståelig for mennesker.

Kort fortalt

En teknik der bruges til at forklare, hvordan en AI-model når frem til sine resultater.

Kategori
teknik
Niveau
øvet

Betydninger

2
  1. 1

    En specifik teknik eller fremgangsmåde designet til at forklare eller visualisere, hvordan en maskinlæringsmodel træffer beslutninger, typisk med henblik på at øge gennemsigtighed og tillid.

    • SHAP er en populær interpretabilitetsmetode, der beregner Shapley-værdier for hver feature i en forudsigelse.Lundberg & Lee, 2017
    • LIME-genererede forklaringer er en lokal interpretabilitetsmetode, der tilnærmer modeladfærd omkring en enkelt instans.Ribeiro et al., 2016
  2. 2

    En samlebetegnelse for alle metoder der sigter mod at gøre AI-systemers beslutninger gennemskuelige og forståelige for mennesker.

    • Fortolkbar AI (XAI) omfatter et bredt spektrum af interpretabilitetsmetoder, fra simple regressionskoefficienter til avancerede neurale forklaringer.

Hvornår bruges det

Interpretabilitetsmetoder anvendes i praksis for at validere modeladfærd, opdage bias og opfylde regulatoriske krav. De kan opdeles i globale metoder (der forklarer hele modellen) og lokale metoder (der forklarer enkelte forudsigelser).

Oprindelse

Sammensat af 'interpretabilitet' (fra latin interpretari, 'forklare') og 'metode' (fra græsk methodos, 'vej til noget').

Kilder

2
  • A Unified Approach to Interpreting Model Predictions (SHAP)
  • Why Should I Trust You? Explaining the Predictions of Any Classifier (LIME)