prediction interval
Et interval inden for hvilket en fremtidig observation forventes at falde med en given sandsynlighed, givet en model.
Kort fortalt
Et prediction interval angiver et interval, hvor en ny datapunkts værdi sandsynligvis vil ligge, baseret på en models forudsigelse.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /prɪˈdɪkʃən ˈɪntəvəl/
Betydninger
1- 1
Et interval estimeret ud fra en model, der med en specificeret konfidens indeholder en fremtidig observation, baseret på modelantagelser og usikkerhed.
- I lineær regression giver et 95% prediction interval for en ny observation en øvre og nedre grænse for den forventede værdi.
- Maskinlæringsmodeller som gradient boosting kan producere prediction intervals via kvantilregression.
Hvornår bruges det
Prediction intervals bruges i regressionsmodeller til at kvantificere usikkerhed omkring individuelle forudsigelser, i modsætning til konfidensintervaller der dækker middelværdien. De er centrale i probabilistisk machine learning og bayesiansk modellering.
Formel
ŷ ± t_{α/2, n-p} * s * √(1 + 1/n + (x₀ - x̄)² / Σ(xᵢ - x̄)²)Kodeeksempel
import numpy as np
from sklearn.ensemble import GradientBoostingRegressor
X = np.random.rand(100, 1) * 10
y = 2 * X.ravel() + np.random.normal(0, 1, 100)
model_low = GradientBoostingRegressor(loss='quantile', alpha=0.1)
model_low.fit(X, y)
y_low = model_low.predict(X)
model_high = GradientBoostingRegressor(loss='quantile', alpha=0.9)
model_high.fit(X, y)
y_high = model_high.predict(X)
print(list(zip(y_low[:5], y_high[:5])))Eksempel på beregning af 80% prediction interval ved hjælp af kvantilregression med Gradient Boosting.
Oprindelse
Termen kommer fra statistik, hvor 'prediction' henviser til forudsigelse af fremtidige værdier, og 'interval' betegner et område mellem to grænser.
Afledte ord
2Kilder
1- An Introduction to Statistical Learning