indlejring
En indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.
Kort fortalt
Indlejringer omdanner ord eller symboler til talvektorer, så maskiner kan forstå ligheder og relationer mellem dem.
- Kategori
- begreb
- Niveau
- begynder
Betydninger
2- 1
En repræsentation af diskrete objekter (ord, noder, kategorier) som lavdimensionelle, kontinuerte vektorer, således at semantisk eller strukturel lighed afspejles i vektorafstande.
- Ordindlejringer som Word2Vec placerer ensbetydende ord tæt i vektorrummet. — forskningsartikel, 2013
- 2
Processen eller teknologien til at lære sådanne repræsentationer via maskinlæring, ofte som en del af en større model.
- Indlejring af grafnoder muliggør forudsigelse af kantforbindelser. — forskningsartikel, 2016
Hvornår bruges det
Indlejringer bruges som inputlag i neurale netværk til naturligt sprog, anbefalingssystemer og mange andre domæner. De muliggør semantisk søgning, clustering og overførsel af viden mellem opgaver.
Kodeeksempel
import tensorflow as tf
embedding_layer = tf.keras.layers.Embedding(input_dim=1000, output_dim=64)
# Example: embed integer indices
input_tensor = tf.constant([1, 2, 3])
output = embedding_layer(input_tensor)Et simpelt indlejringslag i TensorFlow/Keras, der mapper heltalsindekser til 64-dimensionelle vektorer.
Oprindelse
Fra engelsk 'embedding', afledt af 'embed' (indlejre) med suffikset -ing.
Afledte ord
3Kilder
2- Distributed Representations of Words and Phrases and their Compositionality
- Efficient Estimation of Word Representations in Vector Space