Zero-shot chain-of-thought

En prompting-teknik, hvor en sprogmodel opfordres til at generere ræsonnementstrin uden at få vist eksempler, typisk ved at tilføje 'Lad os tænke trin for trin' til prompten.

Kort fortalt

Zero-shot chain-of-thought får en AI til at ræsonnere højt uden forudgående eksempler – bare ved at bede den om at 'tænke trin for trin'.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En prompting-metode, hvor en stor sprogmodel instrueres til at generere en række mellemliggende ræsonnementstrin, før den giver det endelige svar, uden at der gives nogen eksempler på sådanne træk. Dette opnås typisk ved at tilføje en sætning som 'Lad os tænke trin for trin' til prompten.

    • Ved at tilføje 'Lad os tænke trin for trin' til et matematikspørgsmål kunne modellen løse det korrekt.Kojima et al., 2022
    • Zero-shot chain-of-thought har vist sig at forbedre præstation på ræsonnementopgaver med op til 20-30 procentpoint.Kojima et al., 2022

Hvornår bruges det

Bruges når man vil forbedre modellens præstation på opgaver, der kræver logisk ræsonnement, som matematik eller fælles fornuft, uden at skulle give eksempler. Det er særligt nyttigt i situationer, hvor man ikke har adgang til eksempler eller ønsker at undgå at påvirke modellen med specifikke eksempler.

Oprindelse

Termen er en sammensætning af 'zero-shot' (ingen eksempler) og 'chain-of-thought' (tankekæde), introduceret i en forskningsartikel fra 2022 af Kojima m.fl.

Kilder

1
  • Large Language Models are Zero-Shot Reasoners