TPU
forkortelse for Tensor Processing Unit
En specialbygget ASIC fra Google til at accelerere tensoroperationer i maskinlæringsmodeller, især neuralnetværk.
Kort fortalt
En processor, der er bygget specielt til at køre neurale netværk hurtigere og mere energieffektivt end almindelige CPU'er eller GPU'er.
- Kategori
- værktøj
- Niveau
- øvet
- Udtale
- tiː piː juː
Betydninger
1- 1
En specialbygget ASIC udviklet af Google til at accelerere udførelsen af maskinlæringsmodeller, især dem baseret på tensoroperationer som matrixmultiplikation og konvolution.
- Googles TPU v4 leverer over en exaflop ydeevne i et enkelt pod-system. — Google, 2023
- TPU'er er optimeret til at køre TensorFlow-modeller, men understøtter også JAX og PyTorch. — Google Cloud dokumentation
Hvornår bruges det
TPU'er bruges primært i Googles datacentre til både træning og inferens af store modeller som BERT og GPT. De er tilgængelige via Google Cloud TPU-tjenesten, og forskere og virksomheder kan leje dem til deres egne ML-workloads.
Oprindelse
Forkortelse for 'Tensor Processing Unit'. Tensor refererer til de multidimensionelle arrays, der er centrale i deep learning, og Processing Unit indikerer en specialiseret processor.
Afledte ord
2Kilder
2- In-Datacenter Performance Analysis of a Tensor Processing Unit (Jouppi et al., 2017)
- Google Cloud TPU-dokumentation