ReAct-loop

forkortelse for Reasoning and Acting loop

En iterativ proces hvor en sprogmodel skiftevis ræsonnerer (Reasoning) og handler (Acting) ved at generere tanker og udføre handlinger, ofte i interaktion med eksterne værktøjer.

Kort fortalt

En metode hvor AI'en tænker højt, foretager en handling, observerer resultatet og gentager, for at løse komplekse opgaver.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En fremgangsmåde hvor en sprogmodel i en agent-arkitektur genererer en sekvens af tanker (reasoning traces) og handlinger (actions) i en løkke, hvor hver handling påvirker det næste ræsonnement.

    • I en ReAct-loop kan modellen først ræsonnere 'Jeg skal finde befolkningstallet for Danmark', derefter udføre en søgning, og så ræsonnere over svaret.
    • ReAct-loops bruges ofte i forbindelse med værktøjsbrug for at forbedre faktuel nøjagtighed.

Hvornår bruges det

ReAct-loops bruges typisk i agent-systemer, hvor en LLM skal interagere med omverdenen, fx søge i databaser, kalde API'er eller styre software. Det forbedrer nøjagtigheden ved at lade modellen 'tænke' før den handler.

Kodeeksempel

while not done:
    thought = model.generate_thought(state)
    action = model.choose_action(thought)
    observation = execute(action)
    state.append(observation)

Simpel implementering af en ReAct-loop som en while-løkke med tænkning, handling og observation.

Oprindelse

Termen 'ReAct' er en sammentrækning af 'Reasoning' og 'Acting', introduceret af Yao m.fl. i 2022. 'Loop' henviser til den iterative cyklus af ræsonnement og handling.

Afledte ord

2

Kilder

1