model-interpretabilitetsmetrik
En model-interpretabilitetsmetrik er et kvantitativt mål, der vurderer, hvor let en menneskelig bruger kan forstå eller fortolke en maskinlæringsmodels beslutninger.
Kort fortalt
En metrik, der måler, hvor godt man kan forstå, hvorfor en AI-model træffer sine beslutninger.
- Kategori
- metrik
- Niveau
- øvet
Betydninger
1- 1
Et kvantitativt mål for en maskinlæringsmodels forklarbarhed, ofte baseret på egenskaber som simplicitet, troskab eller forståelighed.
- Model-interpretabilitetsmetrikker som troskabsmetrikken bruges til at evaluere, hvor godt en forklaring repræsenterer modellens faktiske adfærd.
- En ny model-interpretabilitetsmetrik blev foreslået i 2022, der måler modellens beslutningstræers kompleksitet.
Hvornår bruges det
Model-interpretabilitetsmetrikker bruges til at sammenligne forskellige modellers forklarbarhed, f.eks. ved at måle simplicitet af en surrogate model eller stabilitet af feature-attribution metoder. De kan også anvendes til at validere om en models forklaringer er meningsfulde for en given opgave.
Oprindelse
Sammensat af 'model', 'interpretabilitet' (evnen til at fortolke) og 'metrik' (måleenhed). Begrebet opstod i takt med behovet for at kvantificere forklarbarhed i maskinlæring.