context window truncation

Teknik til at forkorte en inputsekvens til den maksimale kontekststørrelse, som en sprogmodel kan håndtere, ved at fjerne dele af teksten.

Kort fortalt

Når en tekst er for lang til en AI-model, klipper man simpelthen enden af (eller begyndelsen) for at få den til at passe.

Kategori: teknik
Niveau: begynder

Betydninger

1
Processen med at afkorte en inputstreng til en given maksimal længde ved at fjerne tegn eller tokens fra starten eller slutningen.
- Hvis prompten overstiger modellens kontekstvindue, anvender vi context window truncation for at fjerne de ældste beskeder. — Eksempel fra praksis
- Context window truncation fra venstre bevarer de nyeste tokens, hvilket er almindeligt i chatbot-applikationer.

Hvornår bruges det

Context window truncation anvendes typisk i præprocessering, før en prompt sendes til en LLM. Man kan vælge at truncate fra højre (fjern slutningen) eller venstre (fjern begyndelsen), afhængigt af om de nyeste eller ældste oplysninger er vigtigst. Det er en simpel, men grov løsning sammenlignet med metoder som sliding window eller chunking.

Kodeeksempel

def truncate_left(text, max_tokens, tokenizer):
    tokens = tokenizer.encode(text)
    if len(tokens) > max_tokens:
        tokens = tokens[-max_tokens:]
    return tokenizer.decode(tokens)

def truncate_right(text, max_tokens, tokenizer):
    tokens = tokenizer.encode(text)
    if len(tokens) > max_tokens:
        tokens = tokens[:max_tokens]
    return tokenizer.decode(tokens)

To simple Python-funktioner til at truncate input fra henholdsvis venstre og højre ved hjælp af en tokenizer.

Oprindelse

Sammensat af 'context window' (kontekstvindue) og 'truncation' (afkortning). Begrebet opstod med moderne sprogmodellers begrænsede kontekstlængde.

Afledte ord

left-side truncation right-side truncation

Kilder

LLM Context Window Limitations

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →