logistisk regression

En statistisk model der forudsiger sandsynligheden for en binær udfaldsvariabel ved at anvende en logistisk funktion på en lineær kombination af inputvariabler.

Kort fortalt

Logistisk regression er en metode til at forudsige et ja/nej-udfald baseret på flere faktorer, f.eks. om en email er spam eller ej.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    En regressionsmodel der forudsiger en binær afhængig variabel ved at estimere sandsynligheden for at et givent input tilhører en bestemt klasse.

    • Modellen anvender logistisk regression til at forudsige om en kunde vil købe et produkt baseret på alder og indkomst.
    • Logistisk regression er ofte baseline-modellen i klassifikationsopgaver.

Hvornår bruges det

Logistisk regression bruges ofte i klassifikationsproblemer, især når man skal fortolke hvilke faktorer der påvirker sandsynligheden for en bestemt begivenhed. Det er en af de mest anvendte modeller i medicin, økonomi og maskinlæring på grund af dens enkelhed og fortolkbarhed.

Formel

logit(p) = ln(p/(1-p)) = β0 + β1x1 + ... + βnxn

Kodeeksempel

from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)
probabilities = model.predict_proba(X_test)[:, 1]

Eksempel på træning og brug af logistisk regression med scikit-learn. Først oprettes en model, så trænes den på træningsdata, og til sidst forudsiges klasser og sandsynligheder på testdata.

Oprindelse

Logistisk regression blev udviklet i 1800-tallet af statistikeren Pierre François Verhulst til at modellere befolkningsvækst. Navnet stammer fra den logistiske funktion, som Verhulst kaldte 'logistique'.

Afledte ord

3

Kilder

1
  • Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression.