binær krydsentropi

En loss-funktion til binær klassifikation, der måler forskellen mellem forudsagte sandsynligheder og faktiske binære labels.

Kort fortalt

Binær krydsentropi er en metode til at måle, hvor godt en model forudsiger ja/nej-svar, ved at straffe forkerte forudsigelser.

Kategori
træning
Niveau
øvet

Betydninger

1
  1. 1

    En tabfunktion for binære klassifikationsmodeller, der kvantificerer forskellen mellem den forudsagte sandsynlighedsfordeling og den sande binære fordeling ved at beregne den negative log-sandsynlighed.

    • Under træning minimeres binær krydsentropi for at forbedre klassifikationsnøjagtigheden.
    • Binær krydsentropi er standard loss-funktionen til logistisk regression.

Hvornår bruges det

Anvendes som tabfunktion under træning af neurale netværk til binære klassifikationsopgaver, f.eks. spamdetektion eller medicinsk diagnose. Kombineres typisk med et sigmoid-aktiveringslag i outputlaget.

Formel

BCE = - (1/N) * Σ [y * log(ŷ) + (1-y) * log(1-ŷ)]

Kodeeksempel

import numpy as np
def binary_cross_entropy(y_true, y_pred):
    return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))

Simpel implementering af binær krydsentropi i NumPy.

Oprindelse

"Binær" henviser til to klasser, "krydsentropi" er en kombination af "kryds" (cross) og "entropi" (informationsteoretisk mål). Termen stammer fra informationsteori og blev overført til maskinlæring.