vektorrepræsentationsrum
Et matematisk rum, hvor hvert element (fx et ord eller en sætning) er repræsenteret som en vektor, således at semantiske relationer afspejles i geometriske afstande og retninger.
Kort fortalt
En måde at omdanne ord, sætninger eller objekter til tal, så computeren kan forstå deres betydning og lighed.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /ˈvɛktɔʁʁɛpʁɛzɛnˈtaːtsjɔnsʁum/
Betydninger
2- 1
Et vektorrum, hvor hver entitet er afbildet til en vektor, typisk i et kontinuert, lavdimensionalt rum, således at strukturer i data bevares.
- Ordene 'konge' og 'dronning' ligger tæt på hinanden i vektorrepræsentationsrummet. — Opdigtet eksempel
- Vektorrepræsentationsrummet for sætningsembeddinger muliggør semantisk søgning. — Opdigtet eksempel
- 2
Specifikt om det rum, der dannes af de indre repræsentationer i et neuralt netværk, fx i et sprogmodels sidste skjulte lag.
- I en transformer-model er vektorrepræsentationsrummet i en given dimension et flerleddet rum, som modellen lærer at organisere efter syntaktiske og semantiske træk.
Hvornår bruges det
Vektorrepræsentationsrum anvendes i sprogmodeller, recommender-systemer og informationssøgning til at måle lighed mellem enheder. Fx bruges ord-embedding-rum som Word2Vec til at finde synonymer eller analogier.
Kodeeksempel
from gensim.models import Word2Vec
model = Word2Vec.load('word2vec.model')
vector = model.wv['konge']
print(vector[:5]) # vis første 5 dimensionerHenter vektorrepræsentationen for ordet 'konge' fra en trænet Word2Vec-model.
Oprindelse
Sammensat af 'vektor' (fra latin vector, 'bærer'), 'repræsentation' og 'rum' (rum i matematisk forstand).