self-consistency decoding
En inferensteknik, der forbedrer pålideligheden af sprogmodellers output ved at generere flere svar og vælge det mest konsistente.
Kort fortalt
Self-consistency decoding er en metode til at gøre sprogmodellers svar mere robuste ved at bede modellen om at generere flere svar og derefter vælge det svar, der er mest konsistent på tværs af generationerne.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En inferensteknik for sprogmodeller, hvor man genererer flere uafhængige svar på samme prompt og derefter vælger det mest konsistente svar ved hjælp af afstemnings- eller lighedsbaserede metoder.
- Ved brug af self-consistency decoding på en matematikopgave genererede modellen fem forskellige udregningsstier og valgte det svar, der optrådte flest gange.
- Self-consistency decoding forbedrer nøjagtigheden af chain-of-thought ræsonnering ved at udjævne støj fra individuelle samplingrunder.
Hvornår bruges det
Bruges typisk i opgaver som matematisk ræsonnering og flertrins logisk deduction, hvor ét forkert trin kan føre til et forkert svar. Ved at sample flere svarstier (f.eks. med høj temperatur) og derefter aggregere via majoritetsafstemning eller konsistensbaseret udvælgelse, opnås højere nøjagtighed.
Kodeeksempel
import random
def self_consistency_decoding(model, prompt, n_samples=5, temperature=0.7):
answers = []
for _ in range(n_samples):
# Simulate generation (in practice, use model.generate)
answer = model.generate(prompt, temperature=temperature)
answers.append(answer)
# Majority voting
most_common = max(set(answers), key=answers.count)
return most_commonEksempel på self-consistency decoding: generér flere svar med høj temperatur og vælg det mest hyppige.
Oprindelse
Udtrykket blev introduceret i 2023 af Wang m.fl. i papiret 'Self-Consistency Improves Chain of Thought Reasoning in Language Models' som en forbedring af chain-of-thought prompting.
Afledte ord
1Kilder
1- Self-Consistency Improves Chain of Thought Reasoning in Language Models