sætnings-embedding-model

En model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.

Kort fortalt

En sætnings-embedding-model oversætter en sætning til et talmønster (en vektor), så computere kan sammenligne sætninger baseret på deres betydning.

Kategori: model
Niveau: øvet

Betydninger

1
En model, typisk baseret på en transformer-arkitektur, som trænes til at producere et fast-dimensionelt embedding for en sætning. Embeddinget bevarer semantisk information, så sætninger med lignende betydning har ens embeddings.
- Vi brugte en sætnings-embedding-model til at finde de mest relevante dokumenter i en stor korpus baseret på en brugers forespørgsel. — Eksempel
- Sentence-BERT er en populær sætnings-embedding-model, der finjusterer BERT til at producere semantisk meningsfulde embeddings. — Reimers & Gurevych, 2019

Hvornår bruges det

Sætnings-embedding-modeller bruges til semantisk søgning, tekstklassifikation, clustering og omskrivningsdetektion. Ofte anvendes modeller som Sentence-BERT eller all-MiniLM-L6-v2 i praksis.

Kodeeksempel

from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-MiniLM-L6-v2')
sentences = ['Dette er en sætning', 'En anden sætning']
embeddings = model.encode(sentences)
print(embeddings.shape)  # (2, 384)

Brug af sentence-transformers biblioteket til at hente embeddings for to sætninger.

Oprindelse

Termen opstod med fremkomsten af neurale netværk, især transformer-modeller, der kunne producere meningsfulde repræsentationer af hele sætninger, inspireret af ord-embeddings som Word2Vec.

Afledte ord

Sentence-BERT sentence transformer all-MiniLM-L6-v2

Kilder

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Efficient Sentence Embedding via Semantic Subspace Analysis

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i model →Tilfældigt opslag →