prediction interval

Et interval inden for hvilket en fremtidig observation forventes at falde med en given sandsynlighed, givet en model.

Kort fortalt

Et prediction interval angiver et interval, hvor en ny datapunkts værdi sandsynligvis vil ligge, baseret på en models forudsigelse.

Kategori
begreb
Niveau
øvet
Udtale
/prɪˈdɪkʃən ˈɪntəvəl/

Betydninger

1
  1. 1

    Et interval estimeret ud fra en model, der med en specificeret konfidens indeholder en fremtidig observation, baseret på modelantagelser og usikkerhed.

    • I lineær regression giver et 95% prediction interval for en ny observation en øvre og nedre grænse for den forventede værdi.
    • Maskinlæringsmodeller som gradient boosting kan producere prediction intervals via kvantilregression.

Hvornår bruges det

Prediction intervals bruges i regressionsmodeller til at kvantificere usikkerhed omkring individuelle forudsigelser, i modsætning til konfidensintervaller der dækker middelværdien. De er centrale i probabilistisk machine learning og bayesiansk modellering.

Formel

ŷ ± t_{α/2, n-p} * s * √(1 + 1/n + (x₀ - x̄)² / Σ(xᵢ - x̄)²)

Kodeeksempel

import numpy as np
from sklearn.ensemble import GradientBoostingRegressor

X = np.random.rand(100, 1) * 10
y = 2 * X.ravel() + np.random.normal(0, 1, 100)

model_low = GradientBoostingRegressor(loss='quantile', alpha=0.1)
model_low.fit(X, y)
y_low = model_low.predict(X)

model_high = GradientBoostingRegressor(loss='quantile', alpha=0.9)
model_high.fit(X, y)
y_high = model_high.predict(X)

print(list(zip(y_low[:5], y_high[:5])))

Eksempel på beregning af 80% prediction interval ved hjælp af kvantilregression med Gradient Boosting.

Oprindelse

Termen kommer fra statistik, hvor 'prediction' henviser til forudsigelse af fremtidige værdier, og 'interval' betegner et område mellem to grænser.

Afledte ord

2

Kilder

1
  • An Introduction to Statistical Learning