Zero-shot chain-of-thought
En prompting-teknik, hvor en sprogmodel opfordres til at generere ræsonnementstrin uden at få vist eksempler, typisk ved at tilføje 'Lad os tænke trin for trin' til prompten.
Kort fortalt
Zero-shot chain-of-thought får en AI til at ræsonnere højt uden forudgående eksempler – bare ved at bede den om at 'tænke trin for trin'.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En prompting-metode, hvor en stor sprogmodel instrueres til at generere en række mellemliggende ræsonnementstrin, før den giver det endelige svar, uden at der gives nogen eksempler på sådanne træk. Dette opnås typisk ved at tilføje en sætning som 'Lad os tænke trin for trin' til prompten.
- Ved at tilføje 'Lad os tænke trin for trin' til et matematikspørgsmål kunne modellen løse det korrekt. — Kojima et al., 2022
- Zero-shot chain-of-thought har vist sig at forbedre præstation på ræsonnementopgaver med op til 20-30 procentpoint. — Kojima et al., 2022
Hvornår bruges det
Bruges når man vil forbedre modellens præstation på opgaver, der kræver logisk ræsonnement, som matematik eller fælles fornuft, uden at skulle give eksempler. Det er særligt nyttigt i situationer, hvor man ikke har adgang til eksempler eller ønsker at undgå at påvirke modellen med specifikke eksempler.
Oprindelse
Termen er en sammensætning af 'zero-shot' (ingen eksempler) og 'chain-of-thought' (tankekæde), introduceret i en forskningsartikel fra 2022 af Kojima m.fl.
Kilder
1- Large Language Models are Zero-Shot Reasoners