RL-agent

forkortelse for reinforcement learning-agent

En RL-agent er en selvstændig enhed, der interagerer med et miljø ved at vælge handlinger baseret på en politik for at maksimere kumulativ belønning.

Kort fortalt

En RL-agent er en lærende entitet, der gennem forsøg og fejl lærer at træffe beslutninger for at opnå flest mulige belønninger.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    I forstærkningslæring er RL-agenten den komponent, der observerer miljøets tilstand, vælger handlinger i henhold til en politik, modtager belønninger og opdaterer sin politik for at forbedre fremtidig præstation.

    • En RL-agent trænes til at spille skak ved at modtage belønning for at vinde partier.
    • I robotteknologi styrer RL-agenten robotarmen baseret på sensordata for at udføre en opgave.

Hvornår bruges det

RL-agenten er kernen i enhver forstærkningslæringsopsætning; den vælger handlinger, modtager feedback og opdaterer sin politik. Bruges inden for robotteknologi, spil, finans og selvkørende biler.

Kodeeksempel

import gym

env = gym.make('CartPole-v1')
def random_agent(observation):
    return env.action_space.sample()

obs = env.reset()
done = False
while not done:
    action = random_agent(obs)
    obs, reward, done, info = env.step(action)

En simpel RL-agent, der vælger tilfældige handlinger i CartPole-miljøet.

Oprindelse

Termen kommer fra forstærkningslæring (RL), hvor en agent er en selvstændig aktør, der lærer af interaktion.

Afledte ord

2

Kilder

2