TPU

forkortelse for Tensor Processing Unit

En specialbygget ASIC fra Google til at accelerere tensoroperationer i maskinlæringsmodeller, især neuralnetværk.

Kort fortalt

En processor, der er bygget specielt til at køre neurale netværk hurtigere og mere energieffektivt end almindelige CPU'er eller GPU'er.

Kategori
værktøj
Niveau
øvet
Udtale
tiː piː juː

Betydninger

1
  1. 1

    En specialbygget ASIC udviklet af Google til at accelerere udførelsen af maskinlæringsmodeller, især dem baseret på tensoroperationer som matrixmultiplikation og konvolution.

    • Googles TPU v4 leverer over en exaflop ydeevne i et enkelt pod-system.Google, 2023
    • TPU'er er optimeret til at køre TensorFlow-modeller, men understøtter også JAX og PyTorch.Google Cloud dokumentation

Hvornår bruges det

TPU'er bruges primært i Googles datacentre til både træning og inferens af store modeller som BERT og GPT. De er tilgængelige via Google Cloud TPU-tjenesten, og forskere og virksomheder kan leje dem til deres egne ML-workloads.

Oprindelse

Forkortelse for 'Tensor Processing Unit'. Tensor refererer til de multidimensionelle arrays, der er centrale i deep learning, og Processing Unit indikerer en specialiseret processor.

Afledte ord

2

Kilder

2
  • In-Datacenter Performance Analysis of a Tensor Processing Unit (Jouppi et al., 2017)
  • Google Cloud TPU-dokumentation