micro-averaged F1

Micro-averaged F1 er en global gennemsnitsberegning af F1-score, der beregnes ved at aggregere sande positive, falske positive og falske negative på tværs af alle klasser og derefter beregne F1 ud fra de samlede tal.

Kort fortalt

I stedet for at beregne F1 for hver klasse og så tage gennemsnittet, lægger micro-averaged F1 alle klassers resultater sammen først og beregner så én samlet F1.

Kategori: metrik
Niveau: øvet
Udtale: /ˈmaɪkroʊ ˈævərɪdʒd ɛf wʌn/

Betydninger

1
En beregningsmetode for F1-score, hvor sande positive, falske positive og falske negative summeres over alle klasser, og derefter beregnes F1 ud fra disse summer. Dette giver lige vægt til hver observation uanset klasse.
- Ved multi-label klassifikation af dokumenter opnåede modellen en micro-averaged F1 på 0.85, hvilket indikerer god gennemsnitlig præstation på tværs af alle etiketter. — Fiktivt eksempel

Hvornår bruges det

Micro-averaged F1 bruges ofte ved multi-label klassifikation eller når klasser er ubalancerede, da den giver lige vægt til hver enkelt observation og ikke til hver klasse. Den er særligt nyttig, når man ønsker en overordnet præstationsmetrik, der ikke favoriserer majoritetsklasser.

Formel

F1_micro = 2 * (TP_micro * precision_micro) / (TP_micro + FP_micro) med TP_micro = sum(TP_i), FP_micro = sum(FP_i), FN_micro = sum(FN_i). Præcision_micro = TP_micro/(TP_micro+FP_micro), recall_micro = TP_micro/(TP_micro+FN_micro).

Kodeeksempel

from sklearn.metrics import f1_score
y_true = [0, 1, 2, 0, 1, 2]
y_pred = [0, 2, 1, 0, 0, 1]
f1_micro = f1_score(y_true, y_pred, average='micro')
print(f1_micro)

Beregning af micro-averaged F1 med scikit-learn. `average='micro'` angiver micro-averaging.

Oprindelse

Termen 'micro-averaged' stammer fra behovet for at aggregere F1-score på tværs af klasser i multi-klasse klassifikation, hvor 'micro' refererer til aggregering på observationsniveau.

Afledte ord

micro-averaged precision micro-averaged recall

Kilder

Scikit-learn: Precision, Recall, F-measures
Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427-437.

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i metrik →Tilfældigt opslag →