few-shot chain-of-thought
Few-shot chain-of-thought er en prompting-teknik, hvor man giver sprogmodellen nogle få eksempler, der hver især indeholder et ræsonnementstrin, så modellen lærer at ræsonnere før den svarer.
Kort fortalt
Kort fortalt: Du viser sprogmodellen 2-5 eksempler på, hvordan man trin for trin tænker sig frem til et svar, og så gør modellen det samme for dine nye spørgsmål.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- /ˈfjuː ʃɒt ˌtʃeɪn əv ˈθɔːt/
Betydninger
1- 1
En prompting-teknik inden for naturlig sprogbehandling, hvor sprogmodellen præsenteres for et lille antal eksempler, der hver indeholder en trinvis ræsonnementkæde, som modellen skal efterligne, når den besvarer nye spørgsmål.
- I et få-eksempel chain-of-thought-prompt gives modellen først to regneeksempler med trinvis forklaring, hvorefter den selv skal regne et nyt talstykke.
- Few-shot CoT anvendes ofte i complex reasoning benchmarks som GSM8K.
Hvornår bruges det
Bruges i opgaver, der kræver logisk ræsonnement, matematik eller flertrinsbeslutninger, hvor modellen ellers ville give et forkert svar. Teknikken forbedrer nøjagtigheden markant ved at tvinge modellen til at 'tænke højt'.
Kodeeksempel
examples = [
{"Q": "Hvad er 2+2?", "A": "2+2 = 4. Svaret er 4."},
{"Q": "Hvad er 5+3?", "A": "5+3 = 8. Svaret er 8."}
]
prompt = "\n".join([f"Q: {ex['Q']}\nA: {ex['A']}" for ex in examples])
prompt += "\nQ: Hvad er 9-4?\nA:"Eksempel på konstruktion af en few-shot chain-of-thought prompt i Python, hvor to eksempler med ræsonnement efterfølges af et nyt spørgsmål.
Oprindelse
Termen stammer fra forskning i prompting (Wei et al., 2022) hvor chain-of-thought (CoT) prompting blev introduceret. Few-shot CoT udvider dette ved at inkludere eksempler med ræsonnement i stedet for blot at tilføje 'tænk trin for trin'.