self-consistency decoding

En inferensteknik, der forbedrer pålideligheden af sprogmodellers output ved at generere flere svar og vælge det mest konsistente.

Kort fortalt

Self-consistency decoding er en metode til at gøre sprogmodellers svar mere robuste ved at bede modellen om at generere flere svar og derefter vælge det svar, der er mest konsistent på tværs af generationerne.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En inferensteknik for sprogmodeller, hvor man genererer flere uafhængige svar på samme prompt og derefter vælger det mest konsistente svar ved hjælp af afstemnings- eller lighedsbaserede metoder.

    • Ved brug af self-consistency decoding på en matematikopgave genererede modellen fem forskellige udregningsstier og valgte det svar, der optrådte flest gange.
    • Self-consistency decoding forbedrer nøjagtigheden af chain-of-thought ræsonnering ved at udjævne støj fra individuelle samplingrunder.

Hvornår bruges det

Bruges typisk i opgaver som matematisk ræsonnering og flertrins logisk deduction, hvor ét forkert trin kan føre til et forkert svar. Ved at sample flere svarstier (f.eks. med høj temperatur) og derefter aggregere via majoritetsafstemning eller konsistensbaseret udvælgelse, opnås højere nøjagtighed.

Kodeeksempel

import random

def self_consistency_decoding(model, prompt, n_samples=5, temperature=0.7):
    answers = []
    for _ in range(n_samples):
        # Simulate generation (in practice, use model.generate)
        answer = model.generate(prompt, temperature=temperature)
        answers.append(answer)
    # Majority voting
    most_common = max(set(answers), key=answers.count)
    return most_common

Eksempel på self-consistency decoding: generér flere svar med høj temperatur og vælg det mest hyppige.

Oprindelse

Udtrykket blev introduceret i 2023 af Wang m.fl. i papiret 'Self-Consistency Improves Chain of Thought Reasoning in Language Models' som en forbedring af chain-of-thought prompting.

Afledte ord

1

Kilder

1
  • Self-Consistency Improves Chain of Thought Reasoning in Language Models