empirisk kumulativ fordelingsfunktion
forkortelse for ECDF
Den empiriske kumulative fordelingsfunktion (ECDF) er en ikke-parametrisk estimator af den sande kumulative fordelingsfunktion, baseret på observerede data.
Kort fortalt
En funktion, der viser andelen af data under en given værdi, brugt til at estimere sandsynlighedsfordelingen af data.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Funktionen, der for enhver reel værdi x angiver andelen af observationer i datasættet, der er mindre end eller lig med x.
- ECDF'en for træningssættet viser, at 80% af dataene har en værdi under 0,5.
- For at teste kalibreringen af en sandsynlighedsmodel kan man plotte ECDF for modelens forudsigelser.
Hvornår bruges det
ECDF bruges ofte til at vurdere, om en model genererer realistiske data, ved at sammenligne ECDF for genererede data med den for reelle data. Den er også central i Kolmogorov–Smirnov-testen.
Formel
ECDF(x) = (1/n) * Σ_{i=1}^n I(x_i ≤ x)Oprindelse
Termen kombinerer 'empirisk' (baseret på observationer) og 'kumulativ fordelingsfunktion' (en funktion der summerer sandsynligheder op til et punkt).