makro-F1-score

Makro-F1-score er gennemsnittet af F1-scores beregnet separat for hver klasse, hvilket giver lige vægt til alle klasser uanset deres størrelse.

Kort fortalt

Makro-F1-score måler modellens præstation ved at tage gennemsnittet af F1-scores for hver klasse, så hver klasse tæller lige meget.

Kategori
metrik
Niveau
øvet

Betydninger

1
  1. 1

    En evalueringsmetrik for klassifikationsmodeller, der beregner det aritmetiske gennemsnit af F1-scores for hver klasse, hvilket giver lige vægt til alle klasser uanset antallet af instanser.

    • På det ubalancerede datasæt opnåede modellen en makro-F1-score på 0,72, hvilket var bedre end den mikro-F1-score på 0,85, da minoritetsklassen blev prioriteret.
    • Ved multi-klasse klassifikation med ulige klassefordelinger anbefales det at rapportere både makro- og vægtede F1-scores for et mere nuanceret billede.

Hvornår bruges det

Makro-F1-score bruges typisk ved evaluering af klassifikationsmodeller på ubalancerede datasæt, hvor man ønsker at give samme vægt til sjældne klasser som til hyppige. Det er især relevant ved multi-klasse klassifikation, hvor en simpel accuracy kan være misvisende.

Formel

F1_macro = (1/N) * sum_{i=1}^{N} F1_i, hvor N er antallet af klasser og F1_i er F1-score for klasse i.

Oprindelse

Termen 'makro' kommer fra græsk 'makros' (stor), og refererer til at beregningen tager et overordnet gennemsnit på tværs af klasser, i modsætning til mikro-F1 som aggregerer på tværs af alle prædiktioner.

Kilder

2