micro-averaged F1
Micro-averaged F1 er en global gennemsnitsberegning af F1-score, der beregnes ved at aggregere sande positive, falske positive og falske negative på tværs af alle klasser og derefter beregne F1 ud fra de samlede tal.
Kort fortalt
I stedet for at beregne F1 for hver klasse og så tage gennemsnittet, lægger micro-averaged F1 alle klassers resultater sammen først og beregner så én samlet F1.
- Kategori
- metrik
- Niveau
- øvet
- Udtale
- /ˈmaɪkroʊ ˈævərɪdʒd ɛf wʌn/
Betydninger
1- 1
En beregningsmetode for F1-score, hvor sande positive, falske positive og falske negative summeres over alle klasser, og derefter beregnes F1 ud fra disse summer. Dette giver lige vægt til hver observation uanset klasse.
- Ved multi-label klassifikation af dokumenter opnåede modellen en micro-averaged F1 på 0.85, hvilket indikerer god gennemsnitlig præstation på tværs af alle etiketter. — Fiktivt eksempel
Hvornår bruges det
Micro-averaged F1 bruges ofte ved multi-label klassifikation eller når klasser er ubalancerede, da den giver lige vægt til hver enkelt observation og ikke til hver klasse. Den er særligt nyttig, når man ønsker en overordnet præstationsmetrik, der ikke favoriserer majoritetsklasser.
Formel
F1_micro = 2 * (TP_micro * precision_micro) / (TP_micro + FP_micro) med TP_micro = sum(TP_i), FP_micro = sum(FP_i), FN_micro = sum(FN_i). Præcision_micro = TP_micro/(TP_micro+FP_micro), recall_micro = TP_micro/(TP_micro+FN_micro).Kodeeksempel
from sklearn.metrics import f1_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]
f1_micro = f1_score(y_true, y_pred, average='micro')
print(f1_micro)Beregning af micro-averaged F1 med scikit-learn. `average='micro'` angiver micro-averaging.
Oprindelse
Termen 'micro-averaged' stammer fra behovet for at aggregere F1-score på tværs af klasser i multi-klasse klassifikation, hvor 'micro' refererer til aggregering på observationsniveau.
Afledte ord
2Kilder
2- Scikit-learn: Precision, Recall, F-measures
- Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427-437.