empirisk kumulativ fordelingsfunktion

forkortelse for ECDF

Den empiriske kumulative fordelingsfunktion (ECDF) er en ikke-parametrisk estimator af den sande kumulative fordelingsfunktion, baseret på observerede data.

Kort fortalt

En funktion, der viser andelen af data under en given værdi, brugt til at estimere sandsynlighedsfordelingen af data.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Funktionen, der for enhver reel værdi x angiver andelen af observationer i datasættet, der er mindre end eller lig med x.

    • ECDF'en for træningssættet viser, at 80% af dataene har en værdi under 0,5.
    • For at teste kalibreringen af en sandsynlighedsmodel kan man plotte ECDF for modelens forudsigelser.

Hvornår bruges det

ECDF bruges ofte til at vurdere, om en model genererer realistiske data, ved at sammenligne ECDF for genererede data med den for reelle data. Den er også central i Kolmogorov–Smirnov-testen.

Formel

ECDF(x) = (1/n) * Σ_{i=1}^n I(x_i ≤ x)

Oprindelse

Termen kombinerer 'empirisk' (baseret på observationer) og 'kumulativ fordelingsfunktion' (en funktion der summerer sandsynligheder op til et punkt).