torchvision
torchvision er et PyTorch-bibliotek til computer vision, der tilbyder datasæt, fortrænede modeller og billedtransformationer.
Kort fortalt
Et værktøj, der gør det let at arbejde med billeddata i PyTorch – du kan hente standard datasæt, anvende transformationer og bruge færdigtrænede modeller.
- Kategori
- værktøj
- Niveau
- øvet
- Udtale
- /tɔːrtʃˈvɪʒən/
Betydninger
1- 1
Et PyTorch-bibliotek med værktøjer til computer vision, herunder datasæt, modeller og transformationer.
- Med torchvision kan man let hente CIFAR-10-datasættet og anvende en række transformationer som rotation og normalisering.
- torchvision.models indeholder fortrænede arkitekturer som ResNet og ViT, der kan bruges til transfer learning.
Hvornår bruges det
torchvision bruges typisk i computer vision-pipelines til at forbehandle billeder, augmentere data og hente eller finjustere fortrænede neurale netværk. Det er standardbiblioteket for computer vision i PyTorch-økosystemet.
Kodeeksempel
import torchvision
import torchvision.transforms as transforms
transform = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)Eksempel på opsætning af transformationer og indlæsning af CIFAR-10 via torchvision.
Oprindelse
Sammensat af 'torch' (som i PyTorch) og 'vision' (computersyn).