kernel-tæthedsestimat
Kernel-tæthedsestimat er en ikke-parametrisk metode til at estimere sandsynlighedstætheden af en tilfældig variabel baseret på en stikprøve.
Kort fortalt
Kort fortalt: Kernel-tæthedsestimat er en måde at tegne en glat kurve over data for at se, hvor tæt punkterne ligger, uden at antage en bestemt fordeling.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En ikke-parametrisk metode til at estimere sandsynlighedstæthedsfunktionen af en kontinuert tilfældig variabel ved at placere en vægtfunktion (kerne) over hvert datapunkt og summere dem.
- KDE bruges ofte i dataanalyse til at visualisere fordelingen af en variabel uden at antage normalitet.
Hvornår bruges det
Kernel-tæthedsestimat bruges ofte til dataanalyse og visualisering for at få et indtryk af fordelingen af data, især når man ikke vil påtvinge en parametrisk model. Det anvendes også i maskinlæring til at estimere tætheder for usædvanlighedsdetektion (anomaly detection) og til at generere syntetiske data.
Formel
f̂(x) = (1/(n·h)) Σᵢ K((x − xᵢ)/h)Kodeeksempel
import numpy as np
from sklearn.neighbors import KernelDensity
# Sample data
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
# Fit KDE with Gaussian kernel and bandwidth 0.5
kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)
# Evaluate density at new points
x_eval = np.linspace(0, 6, 100).reshape(-1, 1)
density = np.exp(kde.score_samples(x_eval))Opretter og anvender et KDE med Gauss-kerne på små data og evaluerer tætheden på en række punkter.
Oprindelse
Ordet 'kernel' henviser til kernefunktionen, der vægter nærliggende datapunkter, mens 'tæthedsestimat' betegner estimeringen af en sandsynlighedstæthed.