TPU-pod

En TPU-pod er en samling af Tensor Processing Units (TPU'er), der er forbundet via et højhastighedsnetværk til stor-skala parallel databehandling og træning af maskinlæringsmodeller.

Kort fortalt

En TPU-pod er som en supercomputer bygget af specialiserede TPU-chips, der arbejder sammen for at træne store AI-modeller hurtigere.

Kategori
begreb
Niveau
øvet
Udtale
/ˈtiː piː juː pɒd/

Betydninger

1
  1. 1

    En hardware-konfiguration bestående af flere TPU'er, der er forbundet via et hurtigt netværk (f.eks. en 2D-torus-topologi) for at muliggøre parallel beregning til stor-skala maskinlæring.

    • Vi trænede GPT-3 på en TPU-pod med 512 TPU-chips og opnåede en træningstid på under en uge.
    • TPU-poden giver mulighed for at skalere træningen lineært med antallet af chips, så længe modellen er stor nok.

Hvornår bruges det

TPU-pods bruges af forskere og virksomheder til at træne meget store sprogmodeller og andre deep learning-modeller, der kræver enorm regnekraft. De konfigureres typisk i Google Cloud som en del af en Cloud TPU-slice, hvor brugeren vælger antallet af TPU'er og arkitektur.

Oprindelse

TPU er en forkortelse for Tensor Processing Unit, Googles specialbyggede chip til maskinlæring. 'Pod' betegner en gruppe af disse chips, der er forbundet i et netværk, inspireret af terminologi fra computing clusters.

Kilder

2
  • Tensor Processing Unit: A Programmable Supercomputer (2017)
  • TPU v4: An Optically Reconfigurable Supercomputer (2023)