kontekstvektor-rum

Et flerdimensionalt vektorrum, hvor hver dimension repræsenterer et semantisk træk, og ord eller sætninger repræsenteres som vektorer, så semantisk lighed afspejles i geometrisk nærhed.

Kort fortalt

Et kontekstvektor-rum er en matematisk model, hvor ord og sætninger bliver til punkter i et rum, så ord med lignende betydning ligger tæt på hinanden.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Et matematisk rum, hvor hvert ord eller sætning repræsenteres som en vektor baseret på dets kontekst, så semantisk lighed svarer til geometrisk nærhed.

    • I et kontekstvektor-rum vil ordet 'bank' have forskellige vektorer afhængig af konteksten, eksempelvis 'flodbred' versus 'pengeinstitut'.
    • Kontekstvektor-rummet muliggør at finde synonymer ved at måle cosinusafstanden mellem vektorer.

Hvornår bruges det

Bruges i sprogmodeller til at repræsentere ord og sætninger som vektorer, ofte kaldet embeddings. Det muliggør beregning af semantisk lighed og anvendes i opgaver som maskinoversættelse og informationssøgning.

Oprindelse

Sammensat af 'kontekst' (sammenhæng), 'vektor' (en rettet størrelse) og 'rum' (et matematisk begreb), inspireret af distributionelle semantik.

Afledte ord

3

Kilder

2
  • Efficient Estimation of Word Representations in Vector Space (Mikolov et al., 2013)
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (Devlin et al., 2019)