logistisk regression
En statistisk model der forudsiger sandsynligheden for en binær udfaldsvariabel ved at anvende en logistisk funktion på en lineær kombination af inputvariabler.
Kort fortalt
Logistisk regression er en metode til at forudsige et ja/nej-udfald baseret på flere faktorer, f.eks. om en email er spam eller ej.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
En regressionsmodel der forudsiger en binær afhængig variabel ved at estimere sandsynligheden for at et givent input tilhører en bestemt klasse.
- Modellen anvender logistisk regression til at forudsige om en kunde vil købe et produkt baseret på alder og indkomst.
- Logistisk regression er ofte baseline-modellen i klassifikationsopgaver.
Hvornår bruges det
Logistisk regression bruges ofte i klassifikationsproblemer, især når man skal fortolke hvilke faktorer der påvirker sandsynligheden for en bestemt begivenhed. Det er en af de mest anvendte modeller i medicin, økonomi og maskinlæring på grund af dens enkelhed og fortolkbarhed.
Formel
logit(p) = ln(p/(1-p)) = β0 + β1x1 + ... + βnxnKodeeksempel
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)
probabilities = model.predict_proba(X_test)[:, 1]Eksempel på træning og brug af logistisk regression med scikit-learn. Først oprettes en model, så trænes den på træningsdata, og til sidst forudsiges klasser og sandsynligheder på testdata.
Oprindelse
Logistisk regression blev udviklet i 1800-tallet af statistikeren Pierre François Verhulst til at modellere befolkningsvækst. Navnet stammer fra den logistiske funktion, som Verhulst kaldte 'logistique'.
Afledte ord
3Kilder
1- Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression.