AUC-PR

forkortelse for Area Under the Precision-Recall Curve

AUC-PR måler arealet under præcision-genkaldelseskurven og opsummerer modellens ydeevne ved alle klassifikationstærskler.

Kort fortalt

AUC-PR fortæller, hvor god en model er til at finde de rigtige positive, når datasættet er ubalanceret, ved at se på både præcision og genkaldelse.

Kategori
metrik
Niveau
øvet

Betydninger

1
  1. 1

    Evaluering af en binær klassifikators evne til at identificere positive instanser, aggregeret over alle tærskler via præcision-genkaldelseskurvens areal.

    • Ved evaluering af den sjældne sygdomsdetektor opnåede vi en AUC-PR på 0,85, hvilket indikerer god adskillelse.
    • AUC-PR er mere informativ end ROC-AUC, når baseline-præcisionen er lav.

Hvornår bruges det

AUC-PR bruges typisk til at evaluere binære klassifikationsmodeller, især når den positive klasse er sjælden. Det giver et mere nuanceret billede end ROC-AUC, fordi det fokuserer på den positive klasses præstation.

Formel

AUC-PR = ∫ P(R) dR, hvor P er præcision og R er genkaldelse, approksimeret ved trapetsreglen.

Oprindelse

AUC-PR er en forkortelse for 'Area Under the Precision-Recall Curve', på dansk 'areal under præcision-genkaldelseskurven'. Det er en videreudvikling af ROC-AUC, bedre egnet til ubalancerede data.

Kilder

2
  • Davis, J., & Goadrich, M. (2006). The relationship between Precision-Recall and ROC curves. ICML.
  • Scikit-learn documentation: Precision-Recall