Interpretability

Evnen til at forstå og forklare, hvordan en AI-model træffer beslutninger.

Kategori
begreb
Niveau
øvet
Udtale
/ɪnˌtɜːrprɪtəˈbɪləti/

Betydninger

2
  1. 1

    En egenskab ved en AI-model, der gør det muligt for mennesker at forstå modellens interne mekanismer og årsagerne bag dens forudsigelser.

    • Manglende interpretabilitet i deep learning-modeller gør det svært at stole på deres beslutninger i sundhedssektoren.fagartikel, 2022
    • Forskere arbejder på at forbedre interpretabiliteten af store sprogmodeller gennem mekanismer som attention maps.forskningsartikel, 2023
  2. 2

    Det tværfaglige forskningsområde, der beskæftiger sig med at udvikle metoder til at gøre AI-modeller mere gennemskuelige og forståelige.

    • Interpretabilitet som forskningsfelt vokser hurtigt, drevet af behovet for ansvarlig AI.konferencebidrag, 2023
    • Inden for interpretabilitet anvendes teknikker som SHAP, LIME og integrerede gradients.lærebog, 2023

Oprindelse

Fra engelsk 'interpretability', dannet af 'interpret' (fortolke) og '-ability' (evne).

Afledte ord

3