indlejring

En indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.

Kort fortalt

Indlejringer omdanner ord eller symboler til talvektorer, så maskiner kan forstå ligheder og relationer mellem dem.

Kategori
begreb
Niveau
begynder

Betydninger

2
  1. 1

    En repræsentation af diskrete objekter (ord, noder, kategorier) som lavdimensionelle, kontinuerte vektorer, således at semantisk eller strukturel lighed afspejles i vektorafstande.

    • Ordindlejringer som Word2Vec placerer ensbetydende ord tæt i vektorrummet.forskningsartikel, 2013
  2. 2

    Processen eller teknologien til at lære sådanne repræsentationer via maskinlæring, ofte som en del af en større model.

    • Indlejring af grafnoder muliggør forudsigelse af kantforbindelser.forskningsartikel, 2016

Hvornår bruges det

Indlejringer bruges som inputlag i neurale netværk til naturligt sprog, anbefalingssystemer og mange andre domæner. De muliggør semantisk søgning, clustering og overførsel af viden mellem opgaver.

Kodeeksempel

import tensorflow as tf
embedding_layer = tf.keras.layers.Embedding(input_dim=1000, output_dim=64)
# Example: embed integer indices
input_tensor = tf.constant([1, 2, 3])
output = embedding_layer(input_tensor)

Et simpelt indlejringslag i TensorFlow/Keras, der mapper heltalsindekser til 64-dimensionelle vektorer.

Oprindelse

Fra engelsk 'embedding', afledt af 'embed' (indlejre) med suffikset -ing.

Afledte ord

3

Kilder

2
  • Distributed Representations of Words and Phrases and their Compositionality
  • Efficient Estimation of Word Representations in Vector Space