model-interpretabilitetsmetrik

En model-interpretabilitetsmetrik er et kvantitativt mål, der vurderer, hvor let en menneskelig bruger kan forstå eller fortolke en maskinlæringsmodels beslutninger.

Kort fortalt

En metrik, der måler, hvor godt man kan forstå, hvorfor en AI-model træffer sine beslutninger.

Kategori
metrik
Niveau
øvet

Betydninger

1
  1. 1

    Et kvantitativt mål for en maskinlæringsmodels forklarbarhed, ofte baseret på egenskaber som simplicitet, troskab eller forståelighed.

    • Model-interpretabilitetsmetrikker som troskabsmetrikken bruges til at evaluere, hvor godt en forklaring repræsenterer modellens faktiske adfærd.
    • En ny model-interpretabilitetsmetrik blev foreslået i 2022, der måler modellens beslutningstræers kompleksitet.

Hvornår bruges det

Model-interpretabilitetsmetrikker bruges til at sammenligne forskellige modellers forklarbarhed, f.eks. ved at måle simplicitet af en surrogate model eller stabilitet af feature-attribution metoder. De kan også anvendes til at validere om en models forklaringer er meningsfulde for en given opgave.

Oprindelse

Sammensat af 'model', 'interpretabilitet' (evnen til at fortolke) og 'metrik' (måleenhed). Begrebet opstod i takt med behovet for at kvantificere forklarbarhed i maskinlæring.