World model

En intern repræsentation af omgivelserne, som en AI-agent bruger til at forudsige fremtidige tilstande og planlægge handlinger.

Kort fortalt

En model af verden, som AI'en lærer for at kunne simulere konsekvenser af sine handlinger.

Kategori
begreb
Niveau
øvet

Betydninger

2
  1. 1

    I kognitionsvidenskab: en mental repræsentation af omverdenen, som et individ bruger til at forstå og interagere med miljøet.

    • Mennesker opdaterer konstant deres world model gennem sanseindtryk.
  2. 2

    I AI: en intern model, typisk et neuralt netværk, der lærer at simulere miljøets overgange og belønninger, så agenten kan planlægge ved at 'forestille sig' fremtidige forløb.

    • DreamerV3 anvender en world model til at rulle mulige handlingssekvenser ud i latent rum.

Hvornår bruges det

World models bruges i model-baseret reinforcement learning og planlægning, hvor agenten træner en model til at forudsige miljøets dynamik, fx i Dreamer-arkitekturen.

Kodeeksempel

class WorldModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.encoder = Encoder()  # state->latent
        self.transition = Transition()  # (latent, action)->latent
        self.reward = RewardPredictor()
    def forward(self, obs, action):
        z = self.encoder(obs)
        z_next = self.transition(z, action)
        r = self.reward(z_next)
        return z_next, r

Forenklet PyTorch-klasse for en world model, der forudsiger næste latente tilstand og belønning.

Oprindelse

Udtrykket kommer fra kognitionsvidenskab og AI-forskning, hvor det beskriver en agents mentale model af verden, populariseret af Ha og Schmidhuber (2018).

Afledte ord

1

Kilder

2
  • World Models (2018)
  • Mastering Atari with Discrete World Models (2020)