sætnings-embedding

En vektorrepræsentation af en hel sætning, som indfanger dens semantiske betydning i et fast antal dimensioner.

Kort fortalt

En sætnings-embedding omdanner en sætning til en talfølge (vektor), så computeren kan måle, hvor ens to sætninger er i betydning.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En vektor (en liste af tal) med fast længde, der repræsenterer den semantiske betydning af en sætning, ofte genereret af en transformer-baseret model.

    • Sætnings-embeddingen for 'Hunden sover' er tæt på embeddingen for 'Kattekillingen hviler', men langt fra 'Bilen kører'.
    • Ved semantisk søgning sammenlignes sætnings-embeddingen af forespørgslen med embeddingerne af dokumenterne.

Hvornår bruges det

Sætnings-embeddings bruges i opgaver som semantisk søgning, tekstklassifikation, clustering af dokumenter og parafrasegenkendelse. Modeller som Sentence-BERT eller universal sentence encoder genererer dem typisk.

Kodeeksempel

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
embedding = model.encode('Denne sætning bliver en vektor.')
print(embedding.shape)  # (384,)

Generering af en sætnings-embedding med Sentence-BERT-modellen.

Oprindelse

Sammensat af 'sætning' og 'embedding' (indlejring). Begrebet stammer fra forskning i neurale netværk til sprogrepræsentation.

Kilder

2