sætnings-embedding-vektor

En sætnings-embedding-vektor er en numerisk vektor, der repræsenterer betydningen af en hel sætning i et kontinuerligt vektorrum.

Kort fortalt

En sætnings-embedding-vektor er en slags fingeraftryk for en sætning, som computere kan bruge til at sammenligne sætninger efter betydning.

Kategori
begreb
Niveau
øvet
Udtale
[ˈsɛtneŋsˌɛmˈbɛdɪŋˌveɡtɔ]

Betydninger

1
  1. 1

    En kontinuerlig, flerdimensionel vektor, der indkoder den semantiske betydning af en hel sætning, typisk genereret af en neural netværksmodel.

    • Sætnings-embedding-vektoren for 'Hunden sover på tæppet' kan sammenlignes med vektoren for 'Hunden ligger og sover på tæppet' for at måle semantisk lighed.
    • Modellen genererer en sætnings-embedding-vektor for hver input-sætning, som derefter bruges til clustering.

Hvornår bruges det

Sætnings-embedding-vektorer bruges i semantisk søgning, tekstklassifikation og parafrasegenkendelse. De muliggør at finde sætninger med lignende betydning på tværs af store tekstmængder ved at beregne cosinus-lighed mellem vektorerne.

Kodeeksempel

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
sentence = "Hunden sover på tæppet."
embedding = model.encode(sentence)
print(embedding.shape)  # (384,)

Henter en sætnings-embedding-vektor for en dansk sætning ved hjælp af en fortrænet model fra sentence-transformers.

Oprindelse

Sammensat af 'sætnings' (genitiv af sætning), 'embedding' (indlejring) og 'vektor' (matematisk størrelse med retning og længde).

Afledte ord

2

Kilder

2
  • Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
  • Learning Semantic Textual Similarity from Conversations