indlejring

En indlejring er en kompakt, tæt vektorrepræsentation af et diskret element (fx et ord eller token) i et kontinuert vektorrum, typisk lært af en model.

Kort fortalt

Indlejringer omdanner ord eller symboler til talvektorer, så maskiner kan forstå ligheder og relationer mellem dem.

Kategori: begreb
Niveau: begynder

Betydninger

1
En repræsentation af diskrete objekter (ord, noder, kategorier) som lavdimensionelle, kontinuerte vektorer, således at semantisk eller strukturel lighed afspejles i vektorafstande.
- Ordindlejringer som Word2Vec placerer ensbetydende ord tæt i vektorrummet. — forskningsartikel, 2013
2
Processen eller teknologien til at lære sådanne repræsentationer via maskinlæring, ofte som en del af en større model.
- Indlejring af grafnoder muliggør forudsigelse af kantforbindelser. — forskningsartikel, 2016

Hvornår bruges det

Indlejringer bruges som inputlag i neurale netværk til naturligt sprog, anbefalingssystemer og mange andre domæner. De muliggør semantisk søgning, clustering og overførsel af viden mellem opgaver.

Kodeeksempel

import tensorflow as tf
embedding_layer = tf.keras.layers.Embedding(input_dim=1000, output_dim=64)
# Example: embed integer indices
input_tensor = tf.constant([1, 2, 3])
output = embedding_layer(input_tensor)

Et simpelt indlejringslag i TensorFlow/Keras, der mapper heltalsindekser til 64-dimensionelle vektorer.

Oprindelse

Fra engelsk 'embedding', afledt af 'embed' (indlejre) med suffikset -ing.

Afledte ord

ordindlejring token-indlejring indlejringslag

Kilder

Distributed Representations of Words and Phrases and their Compositionality
Efficient Estimation of Word Representations in Vector Space

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →