Deep reinforcement learning

Del af maskinlæring hvor en agent lærer at træffe beslutninger gennem interaktion med et miljø ved hjælp af dybe neurale netværk til at tilnærme værdi- eller politikfunktioner.

Kort fortalt

Deep reinforcement learning kombinerer dybe neurale netværk med reinforcement learning, så en algoritme kan lære at spille spil, styre robotter eller optimere komplekse beslutninger ved at prøve sig frem.

Kategori: teknik
Niveau: øvet

Betydninger

1
En metode i maskinlæring hvor en agent lærer en politik (policy) eller værdifunktion gennem interaktion med et miljø, ved brug af dybe neurale netværk til at håndtere højdimensionelle tilstands- eller handlingsrum.
- Deep reinforcement learning gjorde det muligt for AlphaGo at besejre verdensmesteren i Go. — Nature, 2016
- I robotik bruges deep reinforcement learning til at træne robotter til at gribe objekter via trial-and-error i simulering. — OpenAI, 2018

Hvornår bruges det

Deep reinforcement learning anvendes ofte i robotstyring, spil-AI (fx AlphaGo) og autonome systemer, hvor agenten trænes i et simuleret miljø før implementering i virkeligheden.

Oprindelse

Termen opstod omkring 2013-2015, da forskere som DeepMind begyndte at kombinere dybe neurale netværk med reinforcement learning, hvilket førte til gennembrud som DQN til Atari-spil.

Afledte ord

deep Q-network proximal policy optimization deep deterministic policy gradient

Kilder

Human-level control through deep reinforcement learning (Mnih et al., 2015)
Mastering the game of Go with deep neural networks and tree search (Silver et al., 2016)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →