binær log loss
Binær log loss er en tabsfunktion for binær klassifikation, der straffer forkerte forudsigelser logaritmisk baseret på sandsynlighedsudgange.
Kort fortalt
Kort fortalt måler binær log loss, hvor godt en model forudsiger sandsynligheder for to klasser; jo lavere værdi, desto bedre.
- Kategori
- metrik
- Niveau
- øvet
Betydninger
1- 1
En tabsfunktion for binær klassifikation, der måler forskellen mellem forudsagte sandsynligheder og de sande etiketværdier (0 eller 1) ved hjælp af logaritmisk scoring.
- I logistisk regression optimeres vægtene ved at minimere den binære log loss.
Hvornår bruges det
Binær log loss anvendes primært til træning af logistisk regression og neurale netværk til binær klassifikation. Det er standard tabsfunktion i maskinlæringsbiblioteker som scikit-learn og PyTorch til klassifikationsopgaver med sandsynlighedsudgange.
Formel
L(y, p) = - (y log(p) + (1-y) log(1-p))Kodeeksempel
import numpy as np
def binary_log_loss(y_true, y_pred):
y_pred = np.clip(y_pred, 1e-15, 1 - 1e-15)
return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))Implementering af binær log loss i Python ved hjælp af numpy. y_true er sande labels (0/1), y_pred er forudsagte sandsynligheder.
Oprindelse
Termen kommer af 'binær' (to klasser) og 'log loss' (logaritmisk tab), baseret på logaritmen af sandsynligheden.