sætnings-embedding-model

En model der transformerer en sætning til en tæt vektor (embedding), som fanger dens semantiske betydning, så sætninger med lignende betydning placeres tæt i vektorrummet.

Kort fortalt

En sætnings-embedding-model oversætter en sætning til et talmønster (en vektor), så computere kan sammenligne sætninger baseret på deres betydning.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    En model, typisk baseret på en transformer-arkitektur, som trænes til at producere et fast-dimensionelt embedding for en sætning. Embeddinget bevarer semantisk information, så sætninger med lignende betydning har ens embeddings.

    • Vi brugte en sætnings-embedding-model til at finde de mest relevante dokumenter i en stor korpus baseret på en brugers forespørgsel.Eksempel
    • Sentence-BERT er en populær sætnings-embedding-model, der finjusterer BERT til at producere semantisk meningsfulde embeddings.Reimers & Gurevych, 2019

Hvornår bruges det

Sætnings-embedding-modeller bruges til semantisk søgning, tekstklassifikation, clustering og omskrivningsdetektion. Ofte anvendes modeller som Sentence-BERT eller all-MiniLM-L6-v2 i praksis.

Kodeeksempel

from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-MiniLM-L6-v2')
sentences = ['Dette er en sætning', 'En anden sætning']
embeddings = model.encode(sentences)
print(embeddings.shape)  # (2, 384)

Brug af sentence-transformers biblioteket til at hente embeddings for to sætninger.

Oprindelse

Termen opstod med fremkomsten af neurale netværk, især transformer-modeller, der kunne producere meningsfulde repræsentationer af hele sætninger, inspireret af ord-embeddings som Word2Vec.

Afledte ord

3

Kilder

2
  • Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
  • Efficient Sentence Embedding via Semantic Subspace Analysis