Chain-of-thought
En prompting-teknik, hvor modellen opfordres til at generere en ræsonnerende tankekæde trin for trin, før den giver et endeligt svar.
Kort fortalt
Kort fortalt: Man beder modellen om at 'tænke højt' i flere trin, hvilket ofte fører til mere præcise svar.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
2- 1
En prompting-teknik, hvor modellen genererer en sekvens af mellemliggende ræsonnementstrin før svaret.
- Hvad er summen af 2+3*4? Lad os tænke trin for trin: Først udfører vi multiplikationen: 3*4=12, derefter addition: 2+12=14. Så svaret er 14.
- 2
En variant kaldet zero-shot chain-of-thought, hvor man blot tilføjer sætningen 'Lad os tænke trin for trin' uden at give eksempler.
- Prompten 'Løs dette problem. Lad os tænke trin for trin' aktiverer ræsonnementet uden yderligere få-skuds eksempler.
Hvornår bruges det
Bruges i prompts til sprogmodeller for at løse komplekse logiske eller matematiske opgaver. Typisk tilføjer man 'Lad os tænke trin for trin' eller giver eksempler med kæder.
Oprindelse
Udtrykket blev populariseret af Wei et al. i 2022 i artiklen 'Chain-of-Thought Prompting Elicits Reasoning in Large Language Models'.
Afledte ord
2Kilder
2- Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., 2022)
- Large Language Models are Zero-Shot Reasoners (Kojima et al., 2022)