torchvision

torchvision er et PyTorch-bibliotek til computer vision, der tilbyder datasæt, fortrænede modeller og billedtransformationer.

Kort fortalt

Et værktøj, der gør det let at arbejde med billeddata i PyTorch – du kan hente standard datasæt, anvende transformationer og bruge færdigtrænede modeller.

Kategori
værktøj
Niveau
øvet
Udtale
/tɔːrtʃˈvɪʒən/

Betydninger

1
  1. 1

    Et PyTorch-bibliotek med værktøjer til computer vision, herunder datasæt, modeller og transformationer.

    • Med torchvision kan man let hente CIFAR-10-datasættet og anvende en række transformationer som rotation og normalisering.
    • torchvision.models indeholder fortrænede arkitekturer som ResNet og ViT, der kan bruges til transfer learning.

Hvornår bruges det

torchvision bruges typisk i computer vision-pipelines til at forbehandle billeder, augmentere data og hente eller finjustere fortrænede neurale netværk. Det er standardbiblioteket for computer vision i PyTorch-økosystemet.

Kodeeksempel

import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

Eksempel på opsætning af transformationer og indlæsning af CIFAR-10 via torchvision.

Oprindelse

Sammensat af 'torch' (som i PyTorch) og 'vision' (computersyn).

Afledte ord

3

Kilder

1