binær log loss

Binær log loss er en tabsfunktion for binær klassifikation, der straffer forkerte forudsigelser logaritmisk baseret på sandsynlighedsudgange.

Kort fortalt

Kort fortalt måler binær log loss, hvor godt en model forudsiger sandsynligheder for to klasser; jo lavere værdi, desto bedre.

Kategori
metrik
Niveau
øvet

Betydninger

1
  1. 1

    En tabsfunktion for binær klassifikation, der måler forskellen mellem forudsagte sandsynligheder og de sande etiketværdier (0 eller 1) ved hjælp af logaritmisk scoring.

    • I logistisk regression optimeres vægtene ved at minimere den binære log loss.

Hvornår bruges det

Binær log loss anvendes primært til træning af logistisk regression og neurale netværk til binær klassifikation. Det er standard tabsfunktion i maskinlæringsbiblioteker som scikit-learn og PyTorch til klassifikationsopgaver med sandsynlighedsudgange.

Formel

L(y, p) = - (y log(p) + (1-y) log(1-p))

Kodeeksempel

import numpy as np

def binary_log_loss(y_true, y_pred):
    y_pred = np.clip(y_pred, 1e-15, 1 - 1e-15)
    return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))

Implementering af binær log loss i Python ved hjælp af numpy. y_true er sande labels (0/1), y_pred er forudsagte sandsynligheder.

Oprindelse

Termen kommer af 'binær' (to klasser) og 'log loss' (logaritmisk tab), baseret på logaritmen af sandsynligheden.