F1 score

forkortelse for F₁ score

Det harmoniske gennemsnit af præcision og recall, der bruges som en samlet metrik for en klassifikationsmodels nøjagtighed.

Kort fortalt

F1 score er en måde at kombinere præcision og recall på, så du får et balanceret tal, der viser, hvor god din model er til at klassificere korrekt.

Kategori
metrik
Niveau
øvet
Udtale
[efˀˈeːˀn skoːɐ]

Betydninger

1
  1. 1

    Det harmoniske gennemsnit af præcision og recall, beregnet som 2 · (præcision · recall) / (præcision + recall).

    • Modellen opnåede en F1-score på 0,92 på testdatasættet.
    • Ved ubalance i klasser er F1-score mere informativ end accuracy.

Hvornår bruges det

F1 score bruges især ved ubalancerede datasæt, hvor accuracy kan være misvisende. Det er standard i informationssøgning, NLP og medicinsk diagnostik.

Formel

F1 = 2 \cdot \frac{\text{precision} \cdot \text{recall}}{\text{precision} + \text{recall}}

Kodeeksempel

from sklearn.metrics import f1_score

y_true = [0, 1, 0, 1, 1]
y_pred = [0, 1, 0, 0, 1]

f1 = f1_score(y_true, y_pred)
print(f1)  # Output: 0.8

Beregning af F1-score med scikit-learn. Funktionen tager de sande og forudsagte etiketter som input.

Oprindelse

Begrebet stammer fra van Rijsbergens arbejde med evaluationsmetrikker i informationssøgning (1979), hvor Fβ-målet blev introduceret. F1 svarer til β=1, der giver lige vægt til præcision og recall.

Afledte ord

3

Kilder

1
  • Information Retrieval (van Rijsbergen, 1979)