tensor processing unit
En specialbygget hardware-accelerator designet til at udføre tensoroperationer hurtigt og energieffektivt, primært brugt til træning og inferens af neurale netværk.
Kort fortalt
En TPU er en chip, der er optimeret til at køre store neurale netværk – tænk en superhurtig regnemaskine til AI.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- ˈtɛnsər ˈprəʊsɛsɪŋ ˈjuːnɪt
Betydninger
1- 1
En specialbygget integreret kreds (ASIC) udviklet af Google, der optimerer udførelsen af matrix- og tensoroperationer, som er centrale i deep learning-algoritmer, med høj gennemstrømning og lavt energiforbrug.
- Google bruger TPU'er i deres datacentre til at accelerere træningen af sprogmodeller som BERT. — Google, 2016
- Den nyeste TPU v4 kan præstere over en exaflop i flydende komma med lavere præcision. — Google, 2021
Hvornår bruges det
TPU'er bruges især i skybaserede ML-platforme som Google Cloud TPU'er til træning af store sprogmodeller og billedgenkendelsesmodeller. De er også implementeret i edge-enheder, men sjældnere.
Oprindelse
Begrebet blev introduceret af Google i 2016 med den første TPU-chip. 'Tensor' henviser til tensoren som grundlæggende datastruktur i machine learning, og 'processing unit' betegner en processor.