Recall

Recall er en evalueringsmetrik, der måler andelen af korrekt identificerede positive instanser ud af alle faktiske positive instanser.

Kort fortalt

Recall fortæller, hvor god modellen er til at finde alle de relevante positive eksempler – jo højere, desto færre falsk negative.

Kategori
metrik
Niveau
øvet
Udtale
/rɪˈkɔːl/

Betydninger

1
  1. 1

    I maskinlæring og klassifikation: Andelen af sandt positive instanser, der er blevet korrekt identificeret af modellen ud af alle faktiske positive instanser.

    • En høj recall er kritisk i cancerdiagnostik, da det er vigtigt at identificere alle syge patienter, selvom det medfører flere falske positiver.
    • Modellen opnåede en recall på 0,95 på testdata, hvilket betyder at 95 % af de sande positive blev fundet.

Hvornår bruges det

Recall bruges især ved ubalancerede datasæt, hvor det er vigtigt at undgå at overse positive tilfælde, fx i medicinsk diagnostik eller svindeldetektion. Det vægter modellen efter, hvor mange af de sande positive den fanger.

Formel

Recall = TP / (TP + FN)
hvor TP = sandt positive, FN = falsk negative

Kodeeksempel

from sklearn.metrics import recall_score

y_true = [1, 0, 1, 1, 0]
y_pred = [1, 0, 0, 1, 0]
recall = recall_score(y_true, y_pred)  # 2/(2+1) = 0.6667
print(recall)

Beregning af recall med scikit-learn på et lille eksempel.

Oprindelse

Termen 'recall' stammer fra informationssøgning (information retrieval), hvor den oprindeligt beskrev evnen til at 'genkalde' (finde) relevante dokumenter.

Afledte ord

2

Kilder

2