Softmax-regression
En generalisering af logistisk regression til multiklasse-klassifikation, hvor softmax-funktionen bruges til at forudsige sandsynlighedsfordelingen over flere klasser.
Kort fortalt
En metode til at forudsige, hvilken af flere kategorier et input tilhører, ved at beregne sandsynligheder for hver kategori.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
En statistisk model til multiklasse-klassifikation, hvor outputtet for hver klasse er en sandsynlighed, og summen af sandsynligheder er 1.
- Softmax-regression anvendes til at klassificere håndskrevne cifre i MNIST-datasættet. — Eksempel
Hvornår bruges det
Softmax-regression bruges som en grundlæggende klassifikationsmodel, ofte som et outputlag i neurale netværk, eller som en selvstændig lineær model til multiklasse-problemer. Den anvendes typisk, når klasserne er gensidigt udelukkende.
Formel
P(y=i|x) = e^(w_i·x + b_i) / Σ_j e^(w_j·x + b_j) for i ∈ {1,...,K}Kodeeksempel
from sklearn.linear_model import LogisticRegression
model = LogisticRegression(multi_class='multinomial', solver='lbfgs')
model.fit(X_train, y_train)
probs = model.predict_proba(X_test)Brug af scikit-learn til at træne en softmax-regressionsmodel med multinomial logistisk regression.
Oprindelse
Udtrykket 'softmax' refererer til den bløde (soft) maksimumfunktion, der omdanner logits til sandsynligheder, mens 'regression' er historisk brugt på trods af, at det er en klassifikationsmodel.