Lasso

forkortelse for Least Absolute Shrinkage and Selection Operator

Lasso er en regulariseringsmetode til lineær regression, der anvender L1-straf for at fremme sparsommelighed og automatisk variabelselektion.

Kort fortalt

En metode der skrumper nogle koefficienter til nul, så kun de vigtigste variable beholdes.

Kategori: teknik
Niveau: øvet
Udtale: /ˈlæsoʊ/

Betydninger

1
En regulariseringsteknik for lineære modeller, der tilføjer en L1-straf til tabsfunktionen, hvilket tvinger nogle koefficienter til at være nøjagtigt nul og derved udfører variabelselektion.
- Vi anvendte Lasso på genekspressionsdataene for at identificere de mest betydningsfulde gener.
- Lassos evne til at producere sparsomme modeller gør det ideelt til problemstillinger med mange prædiktorvariable.

Hvornår bruges det

Lasso bruges i højdimensionelle datasæt, hvor man ønsker at reducere antallet af prædiktorvariable og undgå overfitting. Det anvendes ofte i kombination med krydsvalidering for at finde den optimale strafparameter λ.

Formel

β̂ = argmin { ∑(y_i - x_i^T β)^2 + λ ∑|β_j| }

Kodeeksempel

from sklearn.linear_model import Lasso
model = Lasso(alpha=0.1)
model.fit(X_train, y_train)

Opretter en Lasso-model med strafparameter α=0.1 og træner den på træningsdata.

Oprindelse

Akronym for Least Absolute Shrinkage and Selection Operator, introduceret af Robert Tibshirani i 1996.

Afledte ord

Lasso-regression Lasso-regularisering

Kilder

Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B, 58(1), 267-288.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (2nd ed.). Springer.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →