RL-agent
forkortelse for reinforcement learning-agent
En RL-agent er en selvstændig enhed, der interagerer med et miljø ved at vælge handlinger baseret på en politik for at maksimere kumulativ belønning.
Kort fortalt
En RL-agent er en lærende entitet, der gennem forsøg og fejl lærer at træffe beslutninger for at opnå flest mulige belønninger.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
I forstærkningslæring er RL-agenten den komponent, der observerer miljøets tilstand, vælger handlinger i henhold til en politik, modtager belønninger og opdaterer sin politik for at forbedre fremtidig præstation.
- En RL-agent trænes til at spille skak ved at modtage belønning for at vinde partier.
- I robotteknologi styrer RL-agenten robotarmen baseret på sensordata for at udføre en opgave.
Hvornår bruges det
RL-agenten er kernen i enhver forstærkningslæringsopsætning; den vælger handlinger, modtager feedback og opdaterer sin politik. Bruges inden for robotteknologi, spil, finans og selvkørende biler.
Kodeeksempel
import gym
env = gym.make('CartPole-v1')
def random_agent(observation):
return env.action_space.sample()
obs = env.reset()
done = False
while not done:
action = random_agent(obs)
obs, reward, done, info = env.step(action)En simpel RL-agent, der vælger tilfældige handlinger i CartPole-miljøet.
Oprindelse
Termen kommer fra forstærkningslæring (RL), hvor en agent er en selvstændig aktør, der lærer af interaktion.