context window size

Maksimalt antal tokens en sprogmodel kan behandle i én sekvens.

Kort fortalt

Hvor meget tekst en AI kan 'se' på én gang.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Den maksimale længde af input, målt i tokens, som en sprogmodel kan håndtere i én fremadrettet beregning.

    • GPT-3 har en context window size på 2048 tokens.GPT-3: Language Models are Few-Shot Learners (2020)

Hvornår bruges det

Bruges til at beskrive begrænsninger i sprogmodeller; en større context window gør det muligt at behandle længere dokumenter eller samtaler.

Oprindelse

Fra engelsk 'context window' (kontekstvindue) og 'size' (størrelse).

Afledte ord

3

Kilder

2
  • Attention Is All You Need (2017)
  • GPT-3: Language Models are Few-Shot Learners (2020)