sætnings-embedding-vektor
En sætnings-embedding-vektor er en numerisk vektor, der repræsenterer betydningen af en hel sætning i et kontinuerligt vektorrum.
Kort fortalt
En sætnings-embedding-vektor er en slags fingeraftryk for en sætning, som computere kan bruge til at sammenligne sætninger efter betydning.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- [ˈsɛtneŋsˌɛmˈbɛdɪŋˌveɡtɔ]
Betydninger
1- 1
En kontinuerlig, flerdimensionel vektor, der indkoder den semantiske betydning af en hel sætning, typisk genereret af en neural netværksmodel.
- Sætnings-embedding-vektoren for 'Hunden sover på tæppet' kan sammenlignes med vektoren for 'Hunden ligger og sover på tæppet' for at måle semantisk lighed.
- Modellen genererer en sætnings-embedding-vektor for hver input-sætning, som derefter bruges til clustering.
Hvornår bruges det
Sætnings-embedding-vektorer bruges i semantisk søgning, tekstklassifikation og parafrasegenkendelse. De muliggør at finde sætninger med lignende betydning på tværs af store tekstmængder ved at beregne cosinus-lighed mellem vektorerne.
Kodeeksempel
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
sentence = "Hunden sover på tæppet."
embedding = model.encode(sentence)
print(embedding.shape) # (384,)Henter en sætnings-embedding-vektor for en dansk sætning ved hjælp af en fortrænet model fra sentence-transformers.
Oprindelse
Sammensat af 'sætnings' (genitiv af sætning), 'embedding' (indlejring) og 'vektor' (matematisk størrelse med retning og længde).
Afledte ord
2Kilder
2- Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
- Learning Semantic Textual Similarity from Conversations