Deep reinforcement learning
Del af maskinlæring hvor en agent lærer at træffe beslutninger gennem interaktion med et miljø ved hjælp af dybe neurale netværk til at tilnærme værdi- eller politikfunktioner.
Kort fortalt
Deep reinforcement learning kombinerer dybe neurale netværk med reinforcement learning, så en algoritme kan lære at spille spil, styre robotter eller optimere komplekse beslutninger ved at prøve sig frem.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En metode i maskinlæring hvor en agent lærer en politik (policy) eller værdifunktion gennem interaktion med et miljø, ved brug af dybe neurale netværk til at håndtere højdimensionelle tilstands- eller handlingsrum.
- Deep reinforcement learning gjorde det muligt for AlphaGo at besejre verdensmesteren i Go. — Nature, 2016
- I robotik bruges deep reinforcement learning til at træne robotter til at gribe objekter via trial-and-error i simulering. — OpenAI, 2018
Hvornår bruges det
Deep reinforcement learning anvendes ofte i robotstyring, spil-AI (fx AlphaGo) og autonome systemer, hvor agenten trænes i et simuleret miljø før implementering i virkeligheden.
Oprindelse
Termen opstod omkring 2013-2015, da forskere som DeepMind begyndte at kombinere dybe neurale netværk med reinforcement learning, hvilket førte til gennembrud som DQN til Atari-spil.
Afledte ord
3Kilder
2- Human-level control through deep reinforcement learning (Mnih et al., 2015)
- Mastering the game of Go with deep neural networks and tree search (Silver et al., 2016)