torchvision

torchvision er et PyTorch-bibliotek til computer vision, der tilbyder datasæt, fortrænede modeller og billedtransformationer.

Kort fortalt

Et værktøj, der gør det let at arbejde med billeddata i PyTorch – du kan hente standard datasæt, anvende transformationer og bruge færdigtrænede modeller.

Kategori: værktøj
Niveau: øvet
Udtale: /tɔːrtʃˈvɪʒən/

Betydninger

1
Et PyTorch-bibliotek med værktøjer til computer vision, herunder datasæt, modeller og transformationer.
- Med torchvision kan man let hente CIFAR-10-datasættet og anvende en række transformationer som rotation og normalisering.
- torchvision.models indeholder fortrænede arkitekturer som ResNet og ViT, der kan bruges til transfer learning.

Hvornår bruges det

torchvision bruges typisk i computer vision-pipelines til at forbehandle billeder, augmentere data og hente eller finjustere fortrænede neurale netværk. Det er standardbiblioteket for computer vision i PyTorch-økosystemet.

Kodeeksempel

import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

Eksempel på opsætning af transformationer og indlæsning af CIFAR-10 via torchvision.

Oprindelse

Sammensat af 'torch' (som i PyTorch) og 'vision' (computersyn).

Afledte ord

torchvision.transforms torchvision.models torchvision.datasets

Kilder

TorchVision: PyTorch's Computer Vision Library

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i værktøj →Tilfældigt opslag →