normaliseret confusion matrix
En normaliseret confusion matrix er en variant af confusion matrix, hvor tællingerne er skaleret til andele, typisk per række (sande klasse) eller per kolonne (forudsagt klasse).
Kort fortalt
En tabel, der viser, hvor stor en andel af hver sand klasse der bliver korrekt klassificeret (eller fejlklassificeret), i stedet for de rå antal.
- Kategori
- metrik
- Niveau
- øvet
Betydninger
2- 1
Confusion matrix normaliseret per række (sande klasse), så hver række summerer til 1 og viser andelen af korrekte og forkerte klassifikationer for hver sand klasse.
- En række-normaliseret confusion matrix viste, at modellen kun klassificerede 60% af de positive eksempler korrekt.
- 2
Confusion matrix normaliseret per kolonne (forudsagt klasse), så hver kolonne summerer til 1 og viser andelen af forudsigelser, der rent faktisk tilhører den pågældende klasse.
- Kolonne-normalisering af confusion matricen afslørede, at kun 40% af de forudsagte positive var korrekte.
Hvornår bruges det
Normaliserede confusion matricer bruges især ved ubalancerede datasæt, hvor rå antal kan være misvisende. Normalisering per række viser recall (sensitivitet), mens normalisering per kolonne viser præcision. Værktøjer som scikit-learn understøtter normalisering via parameteren 'normalize'.
Formel
For en confusion matrix C med række-normalisering: C_{ij}^{norm} = C_{ij} / sum_k C_{ik}Kodeeksempel
from sklearn.metrics import confusion_matrix
import numpy as np
y_true = [0, 1, 0, 1, 0, 1]
y_pred = [0, 0, 0, 1, 1, 1]
cm = confusion_matrix(y_true, y_pred, normalize='true') # række-normalisering
print(cm)Scikit-learn-eksempel, der viser række-normalisering (normalize='true'). Hver række summerer til 1.
Oprindelse
Termen er en udvidelse af 'confusion matrix', der stammer fra statistisk klassifikation og machine learning. 'Normaliseret' henviser til skaleringsprocessen.