expectation

Forventningsværdi (forventning) er et mål for den gennemsnitlige værdi af en stokastisk variabel, vægtet med sandsynligheder.

Kort fortalt

Forventning er den gennemsnitlige værdi du ville få, hvis du gentog et eksperiment uendeligt mange gange.

Kategori
begreb
Niveau
øvet
Udtale
/ˌɛkspɛkˈteɪʃən/

Betydninger

2
  1. 1

    Den forventede værdi af en stokastisk variabel, defineret som sandsynlighedsvægtet sum eller integral af alle mulige udfald.

    • For en fair terning er forventningen E[X] = (1+2+3+4+5+6)/6 = 3.5.
  2. 2

    I forstærkningslæring: den forventede kumulative belønning over tid, som agenten forsøger at maksimere.

    • Værdifunktionen V(s) angiver den forventede afkast fra tilstand s under en given politik.

Hvornår bruges det

Forventning anvendes i maskinlæring til at definere tabsfunktioner (f.eks. forventet tab), i probabilistiske modeller og i forstærkningslæring til at beregne forventet afkast.

Formel

E[X] = ∑ x P(X=x) for diskret stokastisk variabel; E[X] = ∫ x f(x) dx for kontinuert.

Kodeeksempel

import numpy as np
outcomes = np.array([1,2,3,4,5,6])
probabilities = np.ones(6)/6
expectation = np.sum(outcomes * probabilities)
print(expectation)  # 3.5

Python-kode der beregner forventningen for en fair terning.

Oprindelse

Fra latin 'expectare' (vente, se frem til) via fransk og engelsk.

Afledte ord

2

Kilder

2
  • The Elements of Statistical Learning (Hastie et al.)
  • Pattern Recognition and Machine Learning (Bishop)