Recall
Recall er en evalueringsmetrik, der måler andelen af korrekt identificerede positive instanser ud af alle faktiske positive instanser.
Kort fortalt
Recall fortæller, hvor god modellen er til at finde alle de relevante positive eksempler – jo højere, desto færre falsk negative.
- Kategori
- metrik
- Niveau
- øvet
- Udtale
- /rɪˈkɔːl/
Betydninger
1- 1
I maskinlæring og klassifikation: Andelen af sandt positive instanser, der er blevet korrekt identificeret af modellen ud af alle faktiske positive instanser.
- En høj recall er kritisk i cancerdiagnostik, da det er vigtigt at identificere alle syge patienter, selvom det medfører flere falske positiver.
- Modellen opnåede en recall på 0,95 på testdata, hvilket betyder at 95 % af de sande positive blev fundet.
Hvornår bruges det
Recall bruges især ved ubalancerede datasæt, hvor det er vigtigt at undgå at overse positive tilfælde, fx i medicinsk diagnostik eller svindeldetektion. Det vægter modellen efter, hvor mange af de sande positive den fanger.
Formel
Recall = TP / (TP + FN)
hvor TP = sandt positive, FN = falsk negativeKodeeksempel
from sklearn.metrics import recall_score
y_true = [1, 0, 1, 1, 0]
y_pred = [1, 0, 0, 1, 0]
recall = recall_score(y_true, y_pred) # 2/(2+1) = 0.6667
print(recall)Beregning af recall med scikit-learn på et lille eksempel.
Oprindelse
Termen 'recall' stammer fra informationssøgning (information retrieval), hvor den oprindeligt beskrev evnen til at 'genkalde' (finde) relevante dokumenter.