embeddingmodel
En neural netværksmodel, der kortlægger diskrete objekter (ord, sætninger, dokumenter) til kontinuerte vektorer i et højdimensionelt rum, kaldet embeddings.
Kort fortalt
En model, der omsætter ord eller sætninger til tal, så computere kan forstå deres betydning og lighed.
- Kategori
- model
- Niveau
- øvet
- Udtale
- /ˈɛmbɛdɪŋmoˌdɛl/
Betydninger
1- 1
En model, der trænes til at producere vektorrepræsentationer (embeddings) af sproglige enheder, således at semantisk ens enheder placeres tæt i vektorrummet.
- Vi brugte en pre-trænet embeddingmodel til at konvertere kundeklager til embeddings før klassifikation.
- Sentence-BERT er en populær embeddingmodel, der optimeres til semantisk lighed mellem sætninger. — Reimers & Gurevych, 2019
Hvornår bruges det
Embeddingmodeller anvendes i natural language processing (NLP) til opgaver som semantisk søgning, tekstklassifikation, klyngeanalyse og som input til andre neurale netværk. Ofte trænes de på store tekstkorpus og kan genbruges (transfer learning).
Kodeeksempel
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
embedding = model.encode('Hej verden')
print(embedding.shape) # (384,)Opretter en embeddingmodel og genererer en embedding for en sætning.
Oprindelse
Dannet af engelsk 'embedding' (indlejring) og 'model', efter mønster fra 'word embedding'.
Afledte ord
2Kilder
2- Efficient Estimation of Word Representations in Vector Space (2013)
- Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks (2019)