fortrænet billedmodel
En fortrænet billedmodel er et neuralt netværk, der er blevet trænet på en stor billeddatabase (f.eks. ImageNet) og derefter genbruges eller finjusteres til specifikke opgaver inden for computer vision.
Kort fortalt
En fortrænet billedmodel er som en allerede uddannet computer, der kan genkende objekter i billeder, og som du kan tilpasse til dine egne billedopgaver uden at starte forfra.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
Et neuralt netværk, der er blevet trænet på en stor, generisk billeddatabase (som ImageNet) og derpå anvendes som udgangspunkt for andre opgaver via transfer learning.
- Ved at bruge en fortrænet billedmodel som ResNet kan vi opnå høj klassifikationsnøjagtighed på vores eget datasæt med blot få epokers finjustering. — forskningsartikel, 2023
- De fleste moderne computer vision-systemer bygger på fortrænede billedmodeller, der er frigivet af forskningsgrupper og virksomheder. — forskningsartikel, 2022
Hvornår bruges det
Fortrænede billedmodeller anvendes typisk inden for transfer learning, hvor man tager en model trænet på en stor generisk database (som ImageNet) og finjusterer den på en mindre, opgavespecifik database. Dette sparer tid og beregningsressourcer og forbedrer ofte ydeevnen, især når mængden af træningsdata er begrænset.
Kodeeksempel
import torch
import torchvision.models as models
# Load a pre-trained ResNet-18 model
model = models.resnet18(pretrained=True)
# Freeze all layers except the final classification layer
for param in model.parameters():
param.requires_grad = False
# Replace the final layer for a new task (e.g., 10 classes)
num_ftrs = model.fc.in_features
model.fc = torch.nn.Linear(num_ftrs, 10)
# Now the model is ready for fine-tuning on your datasetEksempel på indlæsning af en fortrænet ResNet-18-model fra torchvision, frysning af vægte og tilpasning til en ny klassifikationsopgave.
Oprindelse
Termen 'fortrænet billedmodel' er sammensat af 'fortrænet' (engelsk 'pre-trained') og 'billedmodel' (engelsk 'image model'), en direkte oversættelse fra engelsk.
Afledte ord
2Kilder
2- ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)
- Deep Residual Learning for Image Recognition (He et al., 2016)