embedding space
Et flerdimensionalt vektorrum, hvor hvert punkt repræsenterer en entitet (ord, sætning, billede) som en tæt vektor.
Kort fortalt
En slags 'landkort' over betydninger, hvor ting med ens betydning ligger tæt på hinanden.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Det abstrakte vektorrum, hvori embeddings er indlejret. Dets geometri afspejler semantiske relationer.
- I et ord-embedding space ligger synonymer tættere på hinanden end antonymer.
- Ved at projicere billeder ind i et embedding space kan man finde visuelt lignende billeder.
Hvornår bruges det
Embedding space bruges til at repræsentere data som vektorer, så maskinlæringsmodeller kan arbejde med ligheder og relationer mellem entiteter. Det er centralt i NLP, anbefalingssystemer og søgning.
Kodeeksempel
from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('all-MiniLM-L6-v2')
emb1 = model.encode('Jeg elsker AI')
emb2 = model.encode('Maskinlæring er fantastisk')
cos_sim = util.cos_sim(emb1, emb2)
print(cos_sim)Eksempel på brug af et færdigtrænet modeller til at få embeddings i et fælles embedding space og beregne cosinus-lighed.
Oprindelse
Fra engelsk 'embedding' (indlejring) og 'space' (rum).
Afledte ord
2Kilder
2- Efficient Estimation of Word Representations in Vector Space (Mikolov et al., 2013)
- A Neural Probabilistic Language Model (Bengio et al., 2003)