chain-of-thought-pattern
forkortelse for CoT-pattern
En prompting-teknik, hvor modellen opfordres til at generere en række mellemliggende ræsonnementstrin, før den afgiver det endelige svar.
Kort fortalt
Kort fortalt: Du beder modellen om at 'tænke højt' og skrive sine tanker ned, før den giver svaret – det forbedrer ofte nøjagtigheden på komplekse opgaver.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En prompting-teknik, der opfordrer en sprogmodel til at generere en sekvens af mellemliggende ræsonnementstrin (en 'tankekæde') før det endelige svar, for at forbedre præstationen på opgaver, der kræver logisk ræsonnement.
- Ved at anvende chain-of-thought-pattern i prompten kunne modellen korrekt løse et matematisk problem, den ellers ville have fejlet.
Hvornår bruges det
Chain-of-thought-pattern bruges primært inden for sprogmodeller til opgaver, der kræver logisk ræsonnement, matematik eller flertrinsbeslutninger. Det implementeres ved at tilføje eksempler eller instruktioner i prompten, der viser mellemliggende trin, eller ved at bede modellen om at 'tænk trin for trin'.
Kodeeksempel
import openai
prompt = """Q: Hvad er 24 * 7?
A: Lad os tænke trin for trin. 24 * 7 = (20 * 7) + (4 * 7) = 140 + 28 = 168. Så svaret er 168.
Q: Hvad er 15 * 13?
A: Lad os tænke trin for trin."""
response = openai.Completion.create(
model="text-davinci-003",
prompt=prompt,
max_tokens=100
)
print(response.choices[0].text)Et eksempel på chain-of-thought-prompting, hvor modellen først ser et eksempel med ræsonnementstrin og derefter bliver bedt om at ræsonnere om et nyt problem.
Oprindelse
Udtrykket blev introduceret af Wei et al. i 2022 i artiklen 'Chain-of-Thought Prompting Elicits Reasoning in Large Language Models' og refererer til den tankekæde, modellen genererer.