tensorprodukt
En matematisk operation, der kombinerer to tensorer til en ny tensor med højere rang, defineret som ydre produkt generaliseret til flerdimensionale arrays.
Kort fortalt
En måde at gange to tensorer sammen på, så resultatet får flere dimensioner – fx giver produktet af to vektorer en matrix.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
En binær operation, der tager to tensorer og producerer en ny tensor, hvis elementer er alle produkter af elementer fra de input tensorer, hvilket resulterer i en tensor med en rang, der er summen af rangen af inputtene.
- Tensorproduktet af en vektor v = [1,2] og en vektor w = [3,4] giver en matrix [[1*3,1*4],[2*3,2*4]] = [[3,4],[6,8]].
- I PyTorch bruges torch.ger() til at beregne ydre produkt, som er et specialtilfælde af tensorproduktet.
Hvornår bruges det
Tensorproduktet bruges inden for maskinlæring til at konstruere højerdimensionale repræsentationer, fx i opmærksomhedsmekanismer (attention) og i neurale netværkslag, hvor man kombinerer features på tværs af dimensioner. Det optræder også i matematiske modeller af kvantemekanik og i lineær algebra.
Formel
For tensorer A og B: (A ⊗ B)_{i_1,...,i_m, j_1,...,j_n} = A_{i_1,...,i_m} * B_{j_1,...,j_n}Kodeeksempel
import numpy as np
a = np.array([1,2])
b = np.array([3,4])
c = np.outer(a, b) # tensor product / outer product
print(c) # [[3,4],[6,8]]Beregning af tensorprodukt (ydre produkt) af to vektorer ved hjælp af NumPy.
Oprindelse
Fra latin 'tensus' (spændt) og 'productum' (frembragt). Begrebet opstod i lineær algebra i 1800-tallet.