Lasso-regression
forkortelse for Least Absolute Shrinkage and Selection Operator
Lasso-regression er en lineær regressionsmetode, der anvender L1-regularisering til at udvælge variable og forhindre overfitting ved at straffe absolutte koefficientstørrelser.
Kort fortalt
En teknik, der skrumper nogle koefficienter til nul, så modellen bliver enklere og lettere at fortolke.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- /ˈlæsoʊ rɪˈɡrɛʃən/ (eng.)
Betydninger
1- 1
En lineær regressionsmodel med L1-regularisering, der tilføjer en straf proportional med summen af de absolutte koefficientværdier til tabsfunktionen, hvilket tvinger nogle koefficienter til præcis nul og dermed udfører variabeludvælgelse.
- Lasso-regression kan bruges til at forudsige huspriser baseret på et stort antal attributter, hvor kun de mest relevante beholdes.
- I genetik anvendes Lasso-regression til at identificere gener, der er associeret med en bestemt sygdom.
Hvornår bruges det
Lasso-regression bruges, når man har mange prædiktorvariable og ønsker at finde de vigtigste, samtidig med at man undgår overfitting. Den anvendes ofte i højdimensionelle datasæt, f.eks. inden for genetik eller finans.
Formel
min_w ||Xw - y||₂² + λ||w||₁Kodeeksempel
from sklearn.linear_model import Lasso
model = Lasso(alpha=0.1)
model.fit(X_train, y_train)
print(model.coef_)Opretter en Lasso-model med regulariseringsstyrke alpha=0.1, træner den og udskriver koefficienterne – mange vil være nul.
Oprindelse
Akronymet 'LASSO' står for 'Least Absolute Shrinkage and Selection Operator' og blev introduceret af Robert Tibshirani i 1996.
Afledte ord
2Kilder
1- Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B, 58(1), 267-288.