embedding space

Et flerdimensionalt vektorrum, hvor hvert punkt repræsenterer en entitet (ord, sætning, billede) som en tæt vektor.

Kort fortalt

En slags 'landkort' over betydninger, hvor ting med ens betydning ligger tæt på hinanden.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Det abstrakte vektorrum, hvori embeddings er indlejret. Dets geometri afspejler semantiske relationer.

    • I et ord-embedding space ligger synonymer tættere på hinanden end antonymer.
    • Ved at projicere billeder ind i et embedding space kan man finde visuelt lignende billeder.

Hvornår bruges det

Embedding space bruges til at repræsentere data som vektorer, så maskinlæringsmodeller kan arbejde med ligheder og relationer mellem entiteter. Det er centralt i NLP, anbefalingssystemer og søgning.

Kodeeksempel

from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('all-MiniLM-L6-v2')
emb1 = model.encode('Jeg elsker AI')
emb2 = model.encode('Maskinlæring er fantastisk')
cos_sim = util.cos_sim(emb1, emb2)
print(cos_sim)

Eksempel på brug af et færdigtrænet modeller til at få embeddings i et fælles embedding space og beregne cosinus-lighed.

Oprindelse

Fra engelsk 'embedding' (indlejring) og 'space' (rum).

Afledte ord

2

Kilder

2
  • Efficient Estimation of Word Representations in Vector Space (Mikolov et al., 2013)
  • A Neural Probabilistic Language Model (Bengio et al., 2003)