Chain-of-thought

En prompting-teknik, hvor modellen opfordres til at generere en ræsonnerende tankekæde trin for trin, før den giver et endeligt svar.

Kort fortalt

Kort fortalt: Man beder modellen om at 'tænke højt' i flere trin, hvilket ofte fører til mere præcise svar.

Kategori
teknik
Niveau
øvet

Betydninger

2
  1. 1

    En prompting-teknik, hvor modellen genererer en sekvens af mellemliggende ræsonnementstrin før svaret.

    • Hvad er summen af 2+3*4? Lad os tænke trin for trin: Først udfører vi multiplikationen: 3*4=12, derefter addition: 2+12=14. Så svaret er 14.
  2. 2

    En variant kaldet zero-shot chain-of-thought, hvor man blot tilføjer sætningen 'Lad os tænke trin for trin' uden at give eksempler.

    • Prompten 'Løs dette problem. Lad os tænke trin for trin' aktiverer ræsonnementet uden yderligere få-skuds eksempler.

Hvornår bruges det

Bruges i prompts til sprogmodeller for at løse komplekse logiske eller matematiske opgaver. Typisk tilføjer man 'Lad os tænke trin for trin' eller giver eksempler med kæder.

Oprindelse

Udtrykket blev populariseret af Wei et al. i 2022 i artiklen 'Chain-of-Thought Prompting Elicits Reasoning in Large Language Models'.

Afledte ord

2

Kilder

2
  • Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., 2022)
  • Large Language Models are Zero-Shot Reasoners (Kojima et al., 2022)