sætnings-embedding
En vektorrepræsentation af en hel sætning, som indfanger dens semantiske betydning i et fast antal dimensioner.
Kort fortalt
En sætnings-embedding omdanner en sætning til en talfølge (vektor), så computeren kan måle, hvor ens to sætninger er i betydning.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En vektor (en liste af tal) med fast længde, der repræsenterer den semantiske betydning af en sætning, ofte genereret af en transformer-baseret model.
- Sætnings-embeddingen for 'Hunden sover' er tæt på embeddingen for 'Kattekillingen hviler', men langt fra 'Bilen kører'.
- Ved semantisk søgning sammenlignes sætnings-embeddingen af forespørgslen med embeddingerne af dokumenterne.
Hvornår bruges det
Sætnings-embeddings bruges i opgaver som semantisk søgning, tekstklassifikation, clustering af dokumenter og parafrasegenkendelse. Modeller som Sentence-BERT eller universal sentence encoder genererer dem typisk.
Kodeeksempel
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
embedding = model.encode('Denne sætning bliver en vektor.')
print(embedding.shape) # (384,)Generering af en sætnings-embedding med Sentence-BERT-modellen.
Oprindelse
Sammensat af 'sætning' og 'embedding' (indlejring). Begrebet stammer fra forskning i neurale netværk til sprogrepræsentation.