kernel-tæthedsestimat

Kernel-tæthedsestimat er en ikke-parametrisk metode til at estimere sandsynlighedstætheden af en tilfældig variabel baseret på en stikprøve.

Kort fortalt

Kort fortalt: Kernel-tæthedsestimat er en måde at tegne en glat kurve over data for at se, hvor tæt punkterne ligger, uden at antage en bestemt fordeling.

Kategori: teknik
Niveau: øvet

Betydninger

1
En ikke-parametrisk metode til at estimere sandsynlighedstæthedsfunktionen af en kontinuert tilfældig variabel ved at placere en vægtfunktion (kerne) over hvert datapunkt og summere dem.
- KDE bruges ofte i dataanalyse til at visualisere fordelingen af en variabel uden at antage normalitet.

Hvornår bruges det

Kernel-tæthedsestimat bruges ofte til dataanalyse og visualisering for at få et indtryk af fordelingen af data, især når man ikke vil påtvinge en parametrisk model. Det anvendes også i maskinlæring til at estimere tætheder for usædvanlighedsdetektion (anomaly detection) og til at generere syntetiske data.

Formel

f̂(x) = (1/(n·h)) Σᵢ K((x − xᵢ)/h)

Kodeeksempel

import numpy as np
from sklearn.neighbors import KernelDensity

# Sample data
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)

# Fit KDE with Gaussian kernel and bandwidth 0.5
kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)

# Evaluate density at new points
x_eval = np.linspace(0, 6, 100).reshape(-1, 1)
density = np.exp(kde.score_samples(x_eval))

Opretter og anvender et KDE med Gauss-kerne på små data og evaluerer tætheden på en række punkter.

Oprindelse

Ordet 'kernel' henviser til kernefunktionen, der vægter nærliggende datapunkter, mens 'tæthedsestimat' betegner estimeringen af en sandsynlighedstæthed.

Afledte ord

KDE-graf kernel-funktion

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →