precision-recall
Præcision og recall er to metrikker til evaluering af klassifikationsmodeller, der måler henholdsvis nøjagtigheden af positive forudsigelser og modellens evne til at finde alle relevante tilfælde.
Kort fortalt
Precision-recall fortæller dig, hvor mange af de positive forudsigelser, der var korrekte (precision), og hvor mange af de faktiske positive, der blev fundet (recall).
- Kategori
- metrik
- Niveau
- begynder
- Udtale
- /pʁɪˈsɪʃən ɹɪˈkɔːl/
Betydninger
1- 1
Et par af metrikker, der evaluerer en klassifikationsmodels ydeevne: præcision (andel af sande positive blandt forudsagte positive) og recall (andel af sande positive blandt faktiske positive).
- Modellen opnår en præcision på 0,9 og en recall på 0,7, hvilket indikerer få falske positiver men flere falske negativer.
- I en medicinsk screeningsopgave er recall vigtigere end præcision for at undgå at overse sygdomstilfælde.
Hvornår bruges det
Bruges typisk i binære klassifikationsproblemer, især når klasserne er ubalancerede, og man ønsker at undgå falske positiver eller falske negativer. Præcision og recall kombineres ofte i F1-scoren for at få et samlet mål.
Formel
Præcision = TP / (TP + FP), Recall = TP / (TP + FN)Kodeeksempel
from sklearn.metrics import precision_score, recall_score
# Sande etiketter og forudsigelser
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 0, 1, 0, 0, 1]
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
print(f'Precision: {precision:.2f}, Recall: {recall:.2f}')Eksempel på beregning af præcision og recall med scikit-learn baseret på sande og forudsagte etiketter.
Oprindelse
Begreberne stammer fra informationssøgning (information retrieval), hvor præcision måler andelen af relevante dokumenter blandt de returnerede, og recall måler andelen af relevante dokumenter, der blev fundet.
Afledte ord
3Kilder
2- Introduction to Information Retrieval (Manning, Raghavan, Schütze)
- Scikit-learn documentation: Precision-Recall