GloVe-model
forkortelse for Global Vectors for Word Representation
En model der lærer ordvektorer ved at udnytte globale co-forekomststatistikker fra et korpus.
Kort fortalt
Kort fortalt: GloVe er en metode til at skabe ordvektorer, der fanger ords betydning ved at analysere, hvilke ord der ofte optræder sammen i store tekstmængder.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /ɡloʊv/
Betydninger
1- 1
En distribueret repræsentation af ord, hvor hvert ord kortlægges til en vektor af reelle tal, så ord med lignende betydning har tætte vektorer i et flerdimensionelt rum, lært ved at modellere globale ord-forekomststatistikker.
- GloVe-modellen producerer vektorer, der fanger lineære relationer som 'konge - mand + kvinde ≈ dronning'. — faglitteratur, 2024
- Vi anvendte fortrænede GloVe-vektorer med 300 dimensioner til at forbedre vores tekstklassifikationsmodel. — artikel, 2022
Hvornår bruges det
GloVe-modellen anvendes i natural language processing til at generere ordvektorer, der kan bruges i opgaver som ordassociationsanalyse, tekstklassifikation og maskinoversættelse. Modellen trænes ofte på store korpora som Wikipedia eller Common Crawl og distribueres som fortrænede vektorer.
Kodeeksempel
from gensim.test.utils import datapath
from gensim.models import KeyedVectors
glove_file = datapath("glove.6B.50d.txt")
model = KeyedVectors.load_word2vec_format(glove_file, binary=False)
print(model.most_similar("dog"))Eksempel på indlæsning af GloVe-vektorer med gensim og finde nærmeste ord til 'dog'.
Oprindelse
Udviklet af Stanford NLP-gruppen i 2014 som en forbedring af tidligere word embedding-metoder som word2vec.