Skip-gram

Skip-gram er en neural netværksarkitektur i word2vec, der forudsiger kontekstord ud fra et målord.

Kort fortalt

En metode til at lære vektorrepræsentationer af ord ved at gætte, hvilke ord der typisk optræder i nærheden af et givet ord.

Kategori
model
Niveau
øvet
Udtale
/skɪp ɡræm/

Betydninger

1
  1. 1

    En neural netværksarkitektur inden for word2vec, der træner ord-embeddings ved at forudsige kontekstordene omkring et givet målord.

    • Skip-gram-modellen blev introduceret af Mikolov et al. i 2013.Mikolov et al., 2013
    • Træning af skip-gram på et stort korpus giver ordvektorer, der kan fange komplekse semantiske relationer.

Hvornår bruges det

Skip-gram anvendes til at træne ord-embeddings, især på store tekstkorpus. Den er populær til at fange semantiske relationer og anvendes ofte i NLP-opgaver som dokumentklassifikation, maskinoversættelse og informationssøgning.

Kodeeksempel

from gensim.models import Word2Vec
model = Word2Vec(sentences, vector_size=100, window=5, sg=1, min_count=1)

Træning af en skip-gram model med Gensim. Parameteren sg=1 aktiverer skip-gram.

Oprindelse

Navnet 'skip-gram' hentyder til, at modellen 'springer' (skip) over ordet selv og forudsiger omgivende ord (gram) inden for et vindue.

Afledte ord

2

Kilder

1
  • Efficient Estimation of Word Representations in Vector Space