Ridge regression

Ridge regression er en reguleringsteknik, der anvender L2-straf for at mindske overfitting i lineære regressionsmodeller.

Kort fortalt

Kort fortalt: En metode, der tilføjer en straf for store koefficienter for at forhindre modellen i at blive for kompleks og overtilpasse data.

Kategori: teknik
Niveau: øvet
Udtale: /rɪdʒ rɪˈɡrɛʃən/

Betydninger

1
En reguleringsteknik for lineær regression, der tilføjer en L2-straf på koefficienternes størrelse for at mindske overfitting og håndtere multikollinearitet.
- Ridge regression anvendes ofte i genomik, hvor antallet af gener (prædiktorer) overstiger antallet af patientprøver.
- Ved at justere regulariseringsparameteren λ kan man kontrollere graden af straf i ridge regression.

Hvornår bruges det

Ridge regression bruges, når der er multikollinearitet mellem prædiktorvariabler, eller når antallet af prædiktorer er stort i forhold til antallet af observationer. Det er især nyttigt i lineære modeller, hvor man ønsker at stabilisere estimaterne.

Formel

β̂ = (XᵀX + λI)⁻¹Xᵀy

Kodeeksempel

from sklearn.linear_model import Ridge
model = Ridge(alpha=1.0)
model.fit(X_train, y_train)
predictions = model.predict(X_test)

Eksempel på brug af ridge regression med scikit-learn.

Oprindelse

Ridge regression blev introduceret af Hoerl og Kennard i 1970. Navnet 'ridge' refererer til den rygformede bane af de regulariserede estimater.

Afledte ord

ridge-estimator ridge-regularisering ridge-straf

Kilder

Hoerl, A. E., & Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1), 55–67.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer.

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →