embeddingmodel

En neural netværksmodel, der kortlægger diskrete objekter (ord, sætninger, dokumenter) til kontinuerte vektorer i et højdimensionelt rum, kaldet embeddings.

Kort fortalt

En model, der omsætter ord eller sætninger til tal, så computere kan forstå deres betydning og lighed.

Kategori
model
Niveau
øvet
Udtale
/ˈɛmbɛdɪŋmoˌdɛl/

Betydninger

1
  1. 1

    En model, der trænes til at producere vektorrepræsentationer (embeddings) af sproglige enheder, således at semantisk ens enheder placeres tæt i vektorrummet.

    • Vi brugte en pre-trænet embeddingmodel til at konvertere kundeklager til embeddings før klassifikation.
    • Sentence-BERT er en populær embeddingmodel, der optimeres til semantisk lighed mellem sætninger.Reimers & Gurevych, 2019

Hvornår bruges det

Embeddingmodeller anvendes i natural language processing (NLP) til opgaver som semantisk søgning, tekstklassifikation, klyngeanalyse og som input til andre neurale netværk. Ofte trænes de på store tekstkorpus og kan genbruges (transfer learning).

Kodeeksempel

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
embedding = model.encode('Hej verden')
print(embedding.shape)  # (384,)

Opretter en embeddingmodel og genererer en embedding for en sætning.

Oprindelse

Dannet af engelsk 'embedding' (indlejring) og 'model', efter mønster fra 'word embedding'.

Afledte ord

2

Kilder

2
  • Efficient Estimation of Word Representations in Vector Space (2013)
  • Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks (2019)