expectation
Forventningsværdi (forventning) er et mål for den gennemsnitlige værdi af en stokastisk variabel, vægtet med sandsynligheder.
Kort fortalt
Forventning er den gennemsnitlige værdi du ville få, hvis du gentog et eksperiment uendeligt mange gange.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /ˌɛkspɛkˈteɪʃən/
Betydninger
2- 1
Den forventede værdi af en stokastisk variabel, defineret som sandsynlighedsvægtet sum eller integral af alle mulige udfald.
- For en fair terning er forventningen E[X] = (1+2+3+4+5+6)/6 = 3.5.
- 2
I forstærkningslæring: den forventede kumulative belønning over tid, som agenten forsøger at maksimere.
- Værdifunktionen V(s) angiver den forventede afkast fra tilstand s under en given politik.
Hvornår bruges det
Forventning anvendes i maskinlæring til at definere tabsfunktioner (f.eks. forventet tab), i probabilistiske modeller og i forstærkningslæring til at beregne forventet afkast.
Formel
E[X] = ∑ x P(X=x) for diskret stokastisk variabel; E[X] = ∫ x f(x) dx for kontinuert.Kodeeksempel
import numpy as np
outcomes = np.array([1,2,3,4,5,6])
probabilities = np.ones(6)/6
expectation = np.sum(outcomes * probabilities)
print(expectation) # 3.5Python-kode der beregner forventningen for en fair terning.
Oprindelse
Fra latin 'expectare' (vente, se frem til) via fransk og engelsk.
Afledte ord
2Kilder
2- The Elements of Statistical Learning (Hastie et al.)
- Pattern Recognition and Machine Learning (Bishop)