GloVe-model

forkortelse for Global Vectors for Word Representation

En model der lærer ordvektorer ved at udnytte globale co-forekomststatistikker fra et korpus.

Kort fortalt

Kort fortalt: GloVe er en metode til at skabe ordvektorer, der fanger ords betydning ved at analysere, hvilke ord der ofte optræder sammen i store tekstmængder.

Kategori
model
Niveau
øvet
Udtale
/ɡloʊv/

Betydninger

1
  1. 1

    En distribueret repræsentation af ord, hvor hvert ord kortlægges til en vektor af reelle tal, så ord med lignende betydning har tætte vektorer i et flerdimensionelt rum, lært ved at modellere globale ord-forekomststatistikker.

    • GloVe-modellen producerer vektorer, der fanger lineære relationer som 'konge - mand + kvinde ≈ dronning'.faglitteratur, 2024
    • Vi anvendte fortrænede GloVe-vektorer med 300 dimensioner til at forbedre vores tekstklassifikationsmodel.artikel, 2022

Hvornår bruges det

GloVe-modellen anvendes i natural language processing til at generere ordvektorer, der kan bruges i opgaver som ordassociationsanalyse, tekstklassifikation og maskinoversættelse. Modellen trænes ofte på store korpora som Wikipedia eller Common Crawl og distribueres som fortrænede vektorer.

Kodeeksempel

from gensim.test.utils import datapath
from gensim.models import KeyedVectors
glove_file = datapath("glove.6B.50d.txt")
model = KeyedVectors.load_word2vec_format(glove_file, binary=False)
print(model.most_similar("dog"))

Eksempel på indlæsning af GloVe-vektorer med gensim og finde nærmeste ord til 'dog'.

Oprindelse

Udviklet af Stanford NLP-gruppen i 2014 som en forbedring af tidligere word embedding-metoder som word2vec.

Afledte ord

2

Kilder

2