Embedding-matrix

En embedding-matrix er en vægtmatrix i et neuralt netværk, der kortlægger diskrete tokens til kontinuerte vektorer med lav dimensionalitet.

Kort fortalt

Embedding-matrixen er en tabel, der oversætter hvert ord eller token til et tal-array (vektor), som modellen kan arbejde med.

Kategori: arkitektur
Niveau: øvet
Udtale: /ɛmˈbɛdɪŋ ˈmeɪtrɪks/

Betydninger

1
Den vægtmatrice, der indeholder embeddings-vektorerne for alle tokens i et givent ordforråd, og som bruges til at slå embeddings op via token-indekser.
- Embedding-matrixen i denne transformer-model har størrelsen (ordforråd × 512). — egen praksis
- Under træning opdateres embedding-matrixen via backpropagation, så ens betydningsfulde ord får lignende vektorer. — egen praksis

Hvornår bruges det

Embedding-matrixen bruges typisk som det første lag i sprogmodeller og anbefalingssystemer. Den trænes sammen med resten af netværket, så vektorerne lærer semantiske relationer. Matricen indeholder en række for hvert token i ordforrådet og en kolonne for hver dimension i embeddings-rummet.

Kodeeksempel

import torch.nn as nn
vocab_size, d_model = 10000, 512
embedding_matrix = nn.Embedding(vocab_size, d_model).weight

Opretter en embedding-matrix med 10.000 tokens og 512 dimensioner.

Oprindelse

Sammensat af 'embedding' (indlejring, fra engelsk 'embed', at indlejre) og 'matrix' (matematisk matrix).

Afledte ord

embedding-lag vægtmatrice

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →