stor sprogmodel
En stor sprogmodel er en type neural netværksmodel med et meget stort antal parametre, trænet på store mængder tekstdata, som kan generere og forstå menneskeligt sprog.
Kort fortalt
En stor sprogmodel er en avanceret computer, der har læst enorme mængder tekst og kan skrive svar, oversætte og genkende sprogmønstre.
- Kategori
- model
- Niveau
- begynder
Betydninger
1- 1
En sprogmodel med et meget stort antal parametre (typisk milliarder eller flere), trænet på store tekstkorpus, som udviser avancerede sprogforståelses- og genereringsevner.
- GPT-3 fra OpenAI er en af de mest kendte store sprogmodeller med 175 milliarder parametre. — OpenAI, 2020
- Store sprogmodeller som LLaMA og PaLM har vist imponerende evner til få-skuds læring. — Meta AI, 2023
Hvornår bruges det
Store sprogmodeller anvendes bredt inden for naturlig sprogbehandling til opgaver som tekstgenerering, oversættelse, resumé, spørgsmålssvar og chatbots. De finjusteres ofte til specifikke domæner eller opgaver.
Oprindelse
Udtrykket 'stor sprogmodel' er en oversættelse af det engelske 'large language model'. Det opstod i takt med udviklingen af sprogmodeller med hundredvis af milliarder parametre, især efter introduktionen af GPT-3 i 2020.