Skip-gram
Skip-gram er en neural netværksarkitektur i word2vec, der forudsiger kontekstord ud fra et målord.
Kort fortalt
En metode til at lære vektorrepræsentationer af ord ved at gætte, hvilke ord der typisk optræder i nærheden af et givet ord.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /skɪp ɡræm/
Betydninger
1- 1
En neural netværksarkitektur inden for word2vec, der træner ord-embeddings ved at forudsige kontekstordene omkring et givet målord.
- Skip-gram-modellen blev introduceret af Mikolov et al. i 2013. — Mikolov et al., 2013
- Træning af skip-gram på et stort korpus giver ordvektorer, der kan fange komplekse semantiske relationer.
Hvornår bruges det
Skip-gram anvendes til at træne ord-embeddings, især på store tekstkorpus. Den er populær til at fange semantiske relationer og anvendes ofte i NLP-opgaver som dokumentklassifikation, maskinoversættelse og informationssøgning.
Kodeeksempel
from gensim.models import Word2Vec
model = Word2Vec(sentences, vector_size=100, window=5, sg=1, min_count=1)Træning af en skip-gram model med Gensim. Parameteren sg=1 aktiverer skip-gram.
Oprindelse
Navnet 'skip-gram' hentyder til, at modellen 'springer' (skip) over ordet selv og forudsiger omgivende ord (gram) inden for et vindue.
Afledte ord
2Kilder
1- Efficient Estimation of Word Representations in Vector Space