Softmax-regression

En generalisering af logistisk regression til multiklasse-klassifikation, hvor softmax-funktionen bruges til at forudsige sandsynlighedsfordelingen over flere klasser.

Kort fortalt

En metode til at forudsige, hvilken af flere kategorier et input tilhører, ved at beregne sandsynligheder for hver kategori.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    En statistisk model til multiklasse-klassifikation, hvor outputtet for hver klasse er en sandsynlighed, og summen af sandsynligheder er 1.

    • Softmax-regression anvendes til at klassificere håndskrevne cifre i MNIST-datasættet.Eksempel

Hvornår bruges det

Softmax-regression bruges som en grundlæggende klassifikationsmodel, ofte som et outputlag i neurale netværk, eller som en selvstændig lineær model til multiklasse-problemer. Den anvendes typisk, når klasserne er gensidigt udelukkende.

Formel

P(y=i|x) = e^(w_i·x + b_i) / Σ_j e^(w_j·x + b_j) for i ∈ {1,...,K}

Kodeeksempel

from sklearn.linear_model import LogisticRegression
model = LogisticRegression(multi_class='multinomial', solver='lbfgs')
model.fit(X_train, y_train)
probs = model.predict_proba(X_test)

Brug af scikit-learn til at træne en softmax-regressionsmodel med multinomial logistisk regression.

Oprindelse

Udtrykket 'softmax' refererer til den bløde (soft) maksimumfunktion, der omdanner logits til sandsynligheder, mens 'regression' er historisk brugt på trods af, at det er en klassifikationsmodel.