stor sprogmodel

En stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.

Kort fortalt

En stor sprogmodel er en avanceret computer, der har læst enorme mængder tekst og kan skrive svar, oversætte og genkende sprogmønstre.

Kategori
model
Niveau
begynder

Betydninger

1
  1. 1

    En sprogmodel med et meget stort antal parametre (typisk milliarder eller flere), trænet på store tekstkorpus, som udviser avancerede sprogforståelses- og genereringsevner.

    • GPT-3 fra OpenAI er en af de mest kendte store sprogmodeller med 175 milliarder parametre.OpenAI, 2020
    • Store sprogmodeller som LLaMA og PaLM har vist imponerende evner til få-skuds læring.Meta AI, 2023

Hvornår bruges det

Store sprogmodeller anvendes bredt inden for naturlig sprogbehandling til opgaver som tekstgenerering, oversættelse, resumé, spørgsmålssvar og chatbots. De finjusteres ofte til specifikke domæner eller opgaver.

Oprindelse

Udtrykket 'stor sprogmodel' er en oversættelse af det engelske 'large language model'. Det opstod i takt med udviklingen af sprogmodeller med hundredvis af milliarder parametre, især efter introduktionen af GPT-3 i 2020.

Afledte ord

1

Kilder

3