tensor core
En specialiseret hardwareenhed i NVIDIA GPU'er designet til effektivt at udføre matrix-multiplikation og andre tensoroperationer, typisk med blandet præcision.
Kort fortalt
En særlig regneenhed i visse grafikkort, der er optimeret til hurtig udførelse af store matrixberegninger, hvilket især gavner deep learning.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- /ˈtɛnsər kɔr/
Betydninger
1- 1
En dedikeret hardwareenhed i NVIDIA GPU'er, der udfører matrix-multiplikation og andre tensoroperationer med høj gennemløbshastighed, ofte ved at bruge blandet præcision for at accelerere deep learning-arbejdsbelastninger.
- Volta-arkitekturen introducerede tensor cores, der kan udføre 4×4 matrix-multiplikation på ét clock cycle. — NVIDIA, 2017
- Ved at bruge tensor cores i blandet præcision kan træningstiden for store neurale netværk reduceres betydeligt. — NVIDIA Documentation
Hvornår bruges det
Tensor cores anvendes primært til accelereret træning og inferens af deep learning-modeller, hvor de udfører matrix-multiplikationer i blandet præcision (fx FP16 og FP32). De findes i NVIDIA's Volta-, Turing- og Ampere-arkitekturer.
Formel
Matrix multiplication: C = A × B, where A and B are matrices of dimensions m×k and k×n, respectively. Tensor cores can perform this operation with reduced precision for higher throughput.Oprindelse
Dannet af 'tensor' (en matematisk struktur) og 'core' (kerne), introduceret af NVIDIA i 2017 med Volta-arkitekturen.