binær krydsentropi
En loss-funktion til binær klassifikation, der måler forskellen mellem forudsagte sandsynligheder og faktiske binære labels.
Kort fortalt
Binær krydsentropi er en metode til at måle, hvor godt en model forudsiger ja/nej-svar, ved at straffe forkerte forudsigelser.
- Kategori
- træning
- Niveau
- øvet
Betydninger
1- 1
En tabfunktion for binære klassifikationsmodeller, der kvantificerer forskellen mellem den forudsagte sandsynlighedsfordeling og den sande binære fordeling ved at beregne den negative log-sandsynlighed.
- Under træning minimeres binær krydsentropi for at forbedre klassifikationsnøjagtigheden.
- Binær krydsentropi er standard loss-funktionen til logistisk regression.
Hvornår bruges det
Anvendes som tabfunktion under træning af neurale netværk til binære klassifikationsopgaver, f.eks. spamdetektion eller medicinsk diagnose. Kombineres typisk med et sigmoid-aktiveringslag i outputlaget.
Formel
BCE = - (1/N) * Σ [y * log(ŷ) + (1-y) * log(1-ŷ)]Kodeeksempel
import numpy as np
def binary_cross_entropy(y_true, y_pred):
return -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))Simpel implementering af binær krydsentropi i NumPy.
Oprindelse
"Binær" henviser til to klasser, "krydsentropi" er en kombination af "kryds" (cross) og "entropi" (informationsteoretisk mål). Termen stammer fra informationsteori og blev overført til maskinlæring.