Lasso

forkortelse for Least Absolute Shrinkage and Selection Operator

Lasso er en regulariseringsmetode til lineær regression, der anvender L1-straf for at fremme sparsommelighed og automatisk variabelselektion.

Kort fortalt

En metode der skrumper nogle koefficienter til nul, så kun de vigtigste variable beholdes.

Kategori
teknik
Niveau
øvet
Udtale
/ˈlæsoʊ/

Betydninger

1
  1. 1

    En regulariseringsteknik for lineære modeller, der tilføjer en L1-straf til tabsfunktionen, hvilket tvinger nogle koefficienter til at være nøjagtigt nul og derved udfører variabelselektion.

    • Vi anvendte Lasso på genekspressionsdataene for at identificere de mest betydningsfulde gener.
    • Lassos evne til at producere sparsomme modeller gør det ideelt til problemstillinger med mange prædiktorvariable.

Hvornår bruges det

Lasso bruges i højdimensionelle datasæt, hvor man ønsker at reducere antallet af prædiktorvariable og undgå overfitting. Det anvendes ofte i kombination med krydsvalidering for at finde den optimale strafparameter λ.

Formel

β̂ = argmin { ∑(y_i - x_i^T β)^2 + λ ∑|β_j| }

Kodeeksempel

from sklearn.linear_model import Lasso
model = Lasso(alpha=0.1)
model.fit(X_train, y_train)

Opretter en Lasso-model med strafparameter α=0.1 og træner den på træningsdata.

Oprindelse

Akronym for Least Absolute Shrinkage and Selection Operator, introduceret af Robert Tibshirani i 1996.

Afledte ord

2

Kilder

3
  • Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B, 58(1), 267-288.
  • Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (2nd ed.). Springer.
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.