sætnings-embedding-model
En model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.
Kort fortalt
En sætnings-embedding-model oversætter en sætning til et talmønster (en vektor), så computere kan sammenligne sætninger baseret på deres betydning.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
En model, typisk baseret på en transformer-arkitektur, som trænes til at producere et fast-dimensionelt embedding for en sætning. Embeddinget bevarer semantisk information, så sætninger med lignende betydning har ens embeddings.
- Vi brugte en sætnings-embedding-model til at finde de mest relevante dokumenter i en stor korpus baseret på en brugers forespørgsel. — Eksempel
- Sentence-BERT er en populær sætnings-embedding-model, der finjusterer BERT til at producere semantisk meningsfulde embeddings. — Reimers & Gurevych, 2019
Hvornår bruges det
Sætnings-embedding-modeller bruges til semantisk søgning, tekstklassifikation, clustering og omskrivningsdetektion. Ofte anvendes modeller som Sentence-BERT eller all-MiniLM-L6-v2 i praksis.
Kodeeksempel
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
sentences = ['Dette er en sætning', 'En anden sætning']
embeddings = model.encode(sentences)
print(embeddings.shape) # (2, 384)Brug af sentence-transformers biblioteket til at hente embeddings for to sætninger.
Oprindelse
Termen opstod med fremkomsten af neurale netværk, især transformer-modeller, der kunne producere meningsfulde repræsentationer af hele sætninger, inspireret af ord-embeddings som Word2Vec.
Afledte ord
3Kilder
2- Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
- Efficient Sentence Embedding via Semantic Subspace Analysis