tensor core

En specialiseret hardwareenhed i NVIDIA GPU'er designet til effektivt at udføre matrix-multiplikation og andre tensoroperationer, typisk med blandet præcision.

Kort fortalt

En særlig regneenhed i visse grafikkort, der er optimeret til hurtig udførelse af store matrixberegninger, hvilket især gavner deep learning.

Kategori
arkitektur
Niveau
øvet
Udtale
/ˈtɛnsər kɔr/

Betydninger

1
  1. 1

    En dedikeret hardwareenhed i NVIDIA GPU'er, der udfører matrix-multiplikation og andre tensoroperationer med høj gennemløbshastighed, ofte ved at bruge blandet præcision for at accelerere deep learning-arbejdsbelastninger.

    • Volta-arkitekturen introducerede tensor cores, der kan udføre 4×4 matrix-multiplikation på ét clock cycle.NVIDIA, 2017
    • Ved at bruge tensor cores i blandet præcision kan træningstiden for store neurale netværk reduceres betydeligt.NVIDIA Documentation

Hvornår bruges det

Tensor cores anvendes primært til accelereret træning og inferens af deep learning-modeller, hvor de udfører matrix-multiplikationer i blandet præcision (fx FP16 og FP32). De findes i NVIDIA's Volta-, Turing- og Ampere-arkitekturer.

Formel

Matrix multiplication: C = A × B, where A and B are matrices of dimensions m×k and k×n, respectively. Tensor cores can perform this operation with reduced precision for higher throughput.

Oprindelse

Dannet af 'tensor' (en matematisk struktur) og 'core' (kerne), introduceret af NVIDIA i 2017 med Volta-arkitekturen.

Afledte ord

1

Kilder

1