batch inference engine

En batch inference engine er et system, der behandler flere datapunkter samtidigt i en enkelt kørsel af en trænet model.

Kort fortalt

Kort fortalt: Et værktøj, der kører en AI-model på mange eksempler på én gang, i stedet for én ad gangen.

Kategori: teknik
Niveau: øvet

Betydninger

1
En software- eller hardwarekomponent designet til at udføre inferens (forudsigelse) på en samling af inputdata på én gang, ofte med høj gennemstrømning og udnyttelse af parallelisering.
- Batch inference engine'en behandlede 10.000 billeder på under et minut ved hjælp af en GPU-klynge.
- Virksomheder anvender batch inference engines til at generere ugentlige købsanbefalinger fra millioner af brugere.

Hvornår bruges det

Batch inference bruges typisk i offline-scenarier, hvor der ikke er krav om lav latenstid, fx til generering af forudsigelser på store datasæt. Det optimerer ressourceudnyttelsen ved at udnytte parallel computing, især på GPU'er. Eksempler omfatter billedgenkendelse på millioner af billeder eller batch-generering af tekst.

Kodeeksempel

import torch
from torch.utils.data import DataLoader, TensorDataset

model.eval()
dataset = TensorDataset(inputs)
loader = DataLoader(dataset, batch_size=64)
predictions = []
with torch.no_grad():
    for batch in loader:
        pred = model(batch)
        predictions.append(pred)
predictions = torch.cat(predictions)

Eksempel på batch inferens med PyTorch, hvor en DataLoader opdeler data i batches og modellen behandler hvert batch.

Oprindelse

Termen stammer fra forretningsmæssig computing, hvor batch-behandling betyder at udføre en række opgaver uden manuel input. Inference refererer til model-forudsigelse.

Afledte ord

batch inference

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →