few-shot chain-of-thought

Few-shot chain-of-thought er en prompting-teknik, hvor man giver sprogmodellen nogle få eksempler, der hver især indeholder et ræsonnementstrin, så modellen lærer at ræsonnere før den svarer.

Kort fortalt

Kort fortalt: Du viser sprogmodellen 2-5 eksempler på, hvordan man trin for trin tænker sig frem til et svar, og så gør modellen det samme for dine nye spørgsmål.

Kategori
teknik
Niveau
øvet
Udtale
/ˈfjuː ʃɒt ˌtʃeɪn əv ˈθɔːt/

Betydninger

1
  1. 1

    En prompting-teknik inden for naturlig sprogbehandling, hvor sprogmodellen præsenteres for et lille antal eksempler, der hver indeholder en trinvis ræsonnementkæde, som modellen skal efterligne, når den besvarer nye spørgsmål.

    • I et få-eksempel chain-of-thought-prompt gives modellen først to regneeksempler med trinvis forklaring, hvorefter den selv skal regne et nyt talstykke.
    • Few-shot CoT anvendes ofte i complex reasoning benchmarks som GSM8K.

Hvornår bruges det

Bruges i opgaver, der kræver logisk ræsonnement, matematik eller flertrinsbeslutninger, hvor modellen ellers ville give et forkert svar. Teknikken forbedrer nøjagtigheden markant ved at tvinge modellen til at 'tænke højt'.

Kodeeksempel

examples = [
    {"Q": "Hvad er 2+2?", "A": "2+2 = 4. Svaret er 4."},
    {"Q": "Hvad er 5+3?", "A": "5+3 = 8. Svaret er 8."}
]
prompt = "\n".join([f"Q: {ex['Q']}\nA: {ex['A']}" for ex in examples])
prompt += "\nQ: Hvad er 9-4?\nA:"

Eksempel på konstruktion af en few-shot chain-of-thought prompt i Python, hvor to eksempler med ræsonnement efterfølges af et nyt spørgsmål.

Oprindelse

Termen stammer fra forskning i prompting (Wei et al., 2022) hvor chain-of-thought (CoT) prompting blev introduceret. Few-shot CoT udvider dette ved at inkludere eksempler med ræsonnement i stedet for blot at tilføje 'tænk trin for trin'.

Kilder

1