chain-of-thought-pattern

forkortelse for CoT-pattern

En prompting-teknik, hvor modellen opfordres til at generere en række mellemliggende ræsonnementstrin, før den afgiver det endelige svar.

Kort fortalt

Kort fortalt: Du beder modellen om at 'tænke højt' og skrive sine tanker ned, før den giver svaret – det forbedrer ofte nøjagtigheden på komplekse opgaver.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En prompting-teknik, der opfordrer en sprogmodel til at generere en sekvens af mellemliggende ræsonnementstrin (en 'tankekæde') før det endelige svar, for at forbedre præstationen på opgaver, der kræver logisk ræsonnement.

    • Ved at anvende chain-of-thought-pattern i prompten kunne modellen korrekt løse et matematisk problem, den ellers ville have fejlet.

Hvornår bruges det

Chain-of-thought-pattern bruges primært inden for sprogmodeller til opgaver, der kræver logisk ræsonnement, matematik eller flertrinsbeslutninger. Det implementeres ved at tilføje eksempler eller instruktioner i prompten, der viser mellemliggende trin, eller ved at bede modellen om at 'tænk trin for trin'.

Kodeeksempel

import openai

prompt = """Q: Hvad er 24 * 7?
A: Lad os tænke trin for trin. 24 * 7 = (20 * 7) + (4 * 7) = 140 + 28 = 168. Så svaret er 168.

Q: Hvad er 15 * 13?
A: Lad os tænke trin for trin."""

response = openai.Completion.create(
    model="text-davinci-003",
    prompt=prompt,
    max_tokens=100
)
print(response.choices[0].text)

Et eksempel på chain-of-thought-prompting, hvor modellen først ser et eksempel med ræsonnementstrin og derefter bliver bedt om at ræsonnere om et nyt problem.

Oprindelse

Udtrykket blev introduceret af Wei et al. i 2022 i artiklen 'Chain-of-Thought Prompting Elicits Reasoning in Large Language Models' og refererer til den tankekæde, modellen genererer.

Afledte ord

2

Kilder

1