ReAct-loop
forkortelse for Reasoning and Acting loop
En iterativ proces hvor en sprogmodel skiftevis ræsonnerer (Reasoning) og handler (Acting) ved at generere tanker og udføre handlinger, ofte i interaktion med eksterne værktøjer.
Kort fortalt
En metode hvor AI'en tænker højt, foretager en handling, observerer resultatet og gentager, for at løse komplekse opgaver.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En fremgangsmåde hvor en sprogmodel i en agent-arkitektur genererer en sekvens af tanker (reasoning traces) og handlinger (actions) i en løkke, hvor hver handling påvirker det næste ræsonnement.
- I en ReAct-loop kan modellen først ræsonnere 'Jeg skal finde befolkningstallet for Danmark', derefter udføre en søgning, og så ræsonnere over svaret.
- ReAct-loops bruges ofte i forbindelse med værktøjsbrug for at forbedre faktuel nøjagtighed.
Hvornår bruges det
ReAct-loops bruges typisk i agent-systemer, hvor en LLM skal interagere med omverdenen, fx søge i databaser, kalde API'er eller styre software. Det forbedrer nøjagtigheden ved at lade modellen 'tænke' før den handler.
Kodeeksempel
while not done:
thought = model.generate_thought(state)
action = model.choose_action(thought)
observation = execute(action)
state.append(observation)Simpel implementering af en ReAct-loop som en while-løkke med tænkning, handling og observation.
Oprindelse
Termen 'ReAct' er en sammentrækning af 'Reasoning' og 'Acting', introduceret af Yao m.fl. i 2022. 'Loop' henviser til den iterative cyklus af ræsonnement og handling.