normaliseret confusion matrix

En normaliseret confusion matrix er en variant af confusion matrix, hvor tællingerne er skaleret til andele, typisk per række (sande klasse) eller per kolonne (forudsagt klasse).

Kort fortalt

En tabel, der viser, hvor stor en andel af hver sand klasse der bliver korrekt klassificeret (eller fejlklassificeret), i stedet for de rå antal.

Kategori: metrik
Niveau: øvet

Betydninger

1
Confusion matrix normaliseret per række (sande klasse), så hver række summerer til 1 og viser andelen af korrekte og forkerte klassifikationer for hver sand klasse.
- En række-normaliseret confusion matrix viste, at modellen kun klassificerede 60% af de positive eksempler korrekt.
2
Confusion matrix normaliseret per kolonne (forudsagt klasse), så hver kolonne summerer til 1 og viser andelen af forudsigelser, der rent faktisk tilhører den pågældende klasse.
- Kolonne-normalisering af confusion matricen afslørede, at kun 40% af de forudsagte positive var korrekte.

Hvornår bruges det

Normaliserede confusion matricer bruges især ved ubalancerede datasæt, hvor rå antal kan være misvisende. Normalisering per række viser recall (sensitivitet), mens normalisering per kolonne viser præcision. Værktøjer som scikit-learn understøtter normalisering via parameteren 'normalize'.

Formel

For en confusion matrix C med række-normalisering: C_{ij}^{norm} = C_{ij} / sum_k C_{ik}

Kodeeksempel

from sklearn.metrics import confusion_matrix
import numpy as np

y_true = [0, 1, 0, 1, 0, 1]
y_pred = [0, 0, 0, 1, 1, 1]

cm = confusion_matrix(y_true, y_pred, normalize='true')  # række-normalisering
print(cm)

Scikit-learn-eksempel, der viser række-normalisering (normalize='true'). Hver række summerer til 1.

Oprindelse

Termen er en udvidelse af 'confusion matrix', der stammer fra statistisk klassifikation og machine learning. 'Normaliseret' henviser til skaleringsprocessen.

Kilder

scikit-learn documentation: confusion_matrix

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i metrik →Tilfældigt opslag →