kontekstvektor-rum
Et flerdimensionalt vektorrum, hvor hver dimension repræsenterer et semantisk træk, og ord eller sætninger repræsenteres som vektorer, så semantisk lighed afspejles i geometrisk nærhed.
Kort fortalt
Et kontekstvektor-rum er en matematisk model, hvor ord og sætninger bliver til punkter i et rum, så ord med lignende betydning ligger tæt på hinanden.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Et matematisk rum, hvor hvert ord eller sætning repræsenteres som en vektor baseret på dets kontekst, så semantisk lighed svarer til geometrisk nærhed.
- I et kontekstvektor-rum vil ordet 'bank' have forskellige vektorer afhængig af konteksten, eksempelvis 'flodbred' versus 'pengeinstitut'.
- Kontekstvektor-rummet muliggør at finde synonymer ved at måle cosinusafstanden mellem vektorer.
Hvornår bruges det
Bruges i sprogmodeller til at repræsentere ord og sætninger som vektorer, ofte kaldet embeddings. Det muliggør beregning af semantisk lighed og anvendes i opgaver som maskinoversættelse og informationssøgning.
Oprindelse
Sammensat af 'kontekst' (sammenhæng), 'vektor' (en rettet størrelse) og 'rum' (et matematisk begreb), inspireret af distributionelle semantik.
Afledte ord
3Kilder
2- Efficient Estimation of Word Representations in Vector Space (Mikolov et al., 2013)
- BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (Devlin et al., 2019)