vektorrepræsentationsrum

Et matematisk rum, hvor hvert element (fx et ord eller en sætning) er repræsenteret som en vektor, således at semantiske relationer afspejles i geometriske afstande og retninger.

Kort fortalt

En måde at omdanne ord, sætninger eller objekter til tal, så computeren kan forstå deres betydning og lighed.

Kategori
begreb
Niveau
øvet
Udtale
/ˈvɛktɔʁʁɛpʁɛzɛnˈtaːtsjɔnsʁum/

Betydninger

2
  1. 1

    Et vektorrum, hvor hver entitet er afbildet til en vektor, typisk i et kontinuert, lavdimensionalt rum, således at strukturer i data bevares.

    • Ordene 'konge' og 'dronning' ligger tæt på hinanden i vektorrepræsentationsrummet.Opdigtet eksempel
    • Vektorrepræsentationsrummet for sætningsembeddinger muliggør semantisk søgning.Opdigtet eksempel
  2. 2

    Specifikt om det rum, der dannes af de indre repræsentationer i et neuralt netværk, fx i et sprogmodels sidste skjulte lag.

    • I en transformer-model er vektorrepræsentationsrummet i en given dimension et flerleddet rum, som modellen lærer at organisere efter syntaktiske og semantiske træk.

Hvornår bruges det

Vektorrepræsentationsrum anvendes i sprogmodeller, recommender-systemer og informationssøgning til at måle lighed mellem enheder. Fx bruges ord-embedding-rum som Word2Vec til at finde synonymer eller analogier.

Kodeeksempel

from gensim.models import Word2Vec
model = Word2Vec.load('word2vec.model')
vector = model.wv['konge']
print(vector[:5])  # vis første 5 dimensioner

Henter vektorrepræsentationen for ordet 'konge' fra en trænet Word2Vec-model.

Oprindelse

Sammensat af 'vektor' (fra latin vector, 'bærer'), 'repræsentation' og 'rum' (rum i matematisk forstand).

Afledte ord

2

Kilder

2