tensorprodukt

En matematisk operation, der kombinerer to tensorer til en ny tensor med højere rang, defineret som ydre produkt generaliseret til flerdimensionale arrays.

Kort fortalt

En måde at gange to tensorer sammen på, så resultatet får flere dimensioner – fx giver produktet af to vektorer en matrix.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    En binær operation, der tager to tensorer og producerer en ny tensor, hvis elementer er alle produkter af elementer fra de input tensorer, hvilket resulterer i en tensor med en rang, der er summen af rangen af inputtene.

    • Tensorproduktet af en vektor v = [1,2] og en vektor w = [3,4] giver en matrix [[1*3,1*4],[2*3,2*4]] = [[3,4],[6,8]].
    • I PyTorch bruges torch.ger() til at beregne ydre produkt, som er et specialtilfælde af tensorproduktet.

Hvornår bruges det

Tensorproduktet bruges inden for maskinlæring til at konstruere højerdimensionale repræsentationer, fx i opmærksomhedsmekanismer (attention) og i neurale netværkslag, hvor man kombinerer features på tværs af dimensioner. Det optræder også i matematiske modeller af kvantemekanik og i lineær algebra.

Formel

For tensorer A og B: (A ⊗ B)_{i_1,...,i_m, j_1,...,j_n} = A_{i_1,...,i_m} * B_{j_1,...,j_n}

Kodeeksempel

import numpy as np
a = np.array([1,2])
b = np.array([3,4])
c = np.outer(a, b)  # tensor product / outer product
print(c)  # [[3,4],[6,8]]

Beregning af tensorprodukt (ydre produkt) af to vektorer ved hjælp af NumPy.

Oprindelse

Fra latin 'tensus' (spændt) og 'productum' (frembragt). Begrebet opstod i lineær algebra i 1800-tallet.