chain-of-thought-pattern

forkortelse for CoT-pattern

En prompting-teknik, hvor modellen opfordres til at generere en række mellemliggende ræsonnementstrin, før den afgiver det endelige svar.

Kort fortalt

Kort fortalt: Du beder modellen om at 'tænke højt' og skrive sine tanker ned, før den giver svaret – det forbedrer ofte nøjagtigheden på komplekse opgaver.

Kategori: teknik
Niveau: øvet

Betydninger

1
En prompting-teknik, der opfordrer en sprogmodel til at generere en sekvens af mellemliggende ræsonnementstrin (en 'tankekæde') før det endelige svar, for at forbedre præstationen på opgaver, der kræver logisk ræsonnement.
- Ved at anvende chain-of-thought-pattern i prompten kunne modellen korrekt løse et matematisk problem, den ellers ville have fejlet.

Hvornår bruges det

Chain-of-thought-pattern bruges primært inden for sprogmodeller til opgaver, der kræver logisk ræsonnement, matematik eller flertrinsbeslutninger. Det implementeres ved at tilføje eksempler eller instruktioner i prompten, der viser mellemliggende trin, eller ved at bede modellen om at 'tænk trin for trin'.

Kodeeksempel

import openai

prompt = """Q: Hvad er 24 * 7?
A: Lad os tænke trin for trin. 24 * 7 = (20 * 7) + (4 * 7) = 140 + 28 = 168. Så svaret er 168.

Q: Hvad er 15 * 13?
A: Lad os tænke trin for trin."""

response = openai.Completion.create(
    model="text-davinci-003",
    prompt=prompt,
    max_tokens=100
)
print(response.choices[0].text)

Et eksempel på chain-of-thought-prompting, hvor modellen først ser et eksempel med ræsonnementstrin og derefter bliver bedt om at ræsonnere om et nyt problem.

Oprindelse

Udtrykket blev introduceret af Wei et al. i 2022 i artiklen 'Chain-of-Thought Prompting Elicits Reasoning in Large Language Models' og refererer til den tankekæde, modellen genererer.

Afledte ord

CoT-prompting zero-shot chain-of-thought

Kilder

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., 2022)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →