kernel-tæthedsestimat

Kernel-tæthedsestimat er en ikke-parametrisk metode til at estimere sandsynlighedstætheden af en tilfældig variabel baseret på en stikprøve.

Kort fortalt

Kort fortalt: Kernel-tæthedsestimat er en måde at tegne en glat kurve over data for at se, hvor tæt punkterne ligger, uden at antage en bestemt fordeling.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En ikke-parametrisk metode til at estimere sandsynlighedstæthedsfunktionen af en kontinuert tilfældig variabel ved at placere en vægtfunktion (kerne) over hvert datapunkt og summere dem.

    • KDE bruges ofte i dataanalyse til at visualisere fordelingen af en variabel uden at antage normalitet.

Hvornår bruges det

Kernel-tæthedsestimat bruges ofte til dataanalyse og visualisering for at få et indtryk af fordelingen af data, især når man ikke vil påtvinge en parametrisk model. Det anvendes også i maskinlæring til at estimere tætheder for usædvanlighedsdetektion (anomaly detection) og til at generere syntetiske data.

Formel

f̂(x) = (1/(n·h)) Σᵢ K((x − xᵢ)/h)

Kodeeksempel

import numpy as np
from sklearn.neighbors import KernelDensity

# Sample data
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)

# Fit KDE with Gaussian kernel and bandwidth 0.5
kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)

# Evaluate density at new points
x_eval = np.linspace(0, 6, 100).reshape(-1, 1)
density = np.exp(kde.score_samples(x_eval))

Opretter og anvender et KDE med Gauss-kerne på små data og evaluerer tætheden på en række punkter.

Oprindelse

Ordet 'kernel' henviser til kernefunktionen, der vægter nærliggende datapunkter, mens 'tæthedsestimat' betegner estimeringen af en sandsynlighedstæthed.

Afledte ord

2