Lasso-regression

forkortelse for Least Absolute Shrinkage and Selection Operator

Lasso-regression er en lineær regressionsmetode, der anvender L1-regularisering til at udvælge variable og forhindre overfitting ved at straffe absolutte koefficientstørrelser.

Kort fortalt

En teknik, der skrumper nogle koefficienter til nul, så modellen bliver enklere og lettere at fortolke.

Kategori
teknik
Niveau
øvet
Udtale
/ˈlæsoʊ rɪˈɡrɛʃən/ (eng.)

Betydninger

1
  1. 1

    En lineær regressionsmodel med L1-regularisering, der tilføjer en straf proportional med summen af de absolutte koefficientværdier til tabsfunktionen, hvilket tvinger nogle koefficienter til præcis nul og dermed udfører variabeludvælgelse.

    • Lasso-regression kan bruges til at forudsige huspriser baseret på et stort antal attributter, hvor kun de mest relevante beholdes.
    • I genetik anvendes Lasso-regression til at identificere gener, der er associeret med en bestemt sygdom.

Hvornår bruges det

Lasso-regression bruges, når man har mange prædiktorvariable og ønsker at finde de vigtigste, samtidig med at man undgår overfitting. Den anvendes ofte i højdimensionelle datasæt, f.eks. inden for genetik eller finans.

Formel

min_w ||Xw - y||₂² + λ||w||₁

Kodeeksempel

from sklearn.linear_model import Lasso
model = Lasso(alpha=0.1)
model.fit(X_train, y_train)
print(model.coef_)

Opretter en Lasso-model med regulariseringsstyrke alpha=0.1, træner den og udskriver koefficienterne – mange vil være nul.

Oprindelse

Akronymet 'LASSO' står for 'Least Absolute Shrinkage and Selection Operator' og blev introduceret af Robert Tibshirani i 1996.

Afledte ord

2

Kilder

1
  • Tibshirani, R. (1996). Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society: Series B, 58(1), 267-288.