Lasso
forkortelse for Least Absolute Shrinkage and Selection Operator
Lasso er en regulariseringsmetode til lineær regression, der anvender L1-straf for at fremme sparsommelighed og automatisk variabelselektion.
Kort fortalt
En metode der skrumper nogle koefficienter til nul, så kun de vigtigste variable beholdes.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- /ˈlæsoʊ/
Betydninger
1- 1
En regulariseringsteknik for lineære modeller, der tilføjer en L1-straf til tabsfunktionen, hvilket tvinger nogle koefficienter til at være nøjagtigt nul og derved udfører variabelselektion.
- Vi anvendte Lasso på genekspressionsdataene for at identificere de mest betydningsfulde gener.
- Lassos evne til at producere sparsomme modeller gør det ideelt til problemstillinger med mange prædiktorvariable.
Hvornår bruges det
Lasso bruges i højdimensionelle datasæt, hvor man ønsker at reducere antallet af prædiktorvariable og undgå overfitting. Det anvendes ofte i kombination med krydsvalidering for at finde den optimale strafparameter λ.
Formel
β̂ = argmin { ∑(y_i - x_i^T β)^2 + λ ∑|β_j| }Kodeeksempel
from sklearn.linear_model import Lasso
model = Lasso(alpha=0.1)
model.fit(X_train, y_train)Opretter en Lasso-model med strafparameter α=0.1 og træner den på træningsdata.
Oprindelse
Akronym for Least Absolute Shrinkage and Selection Operator, introduceret af Robert Tibshirani i 1996.
Afledte ord
2Kilder
3- Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B, 58(1), 267-288.
- Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning (2nd ed.). Springer.
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning. Springer.