fortrænet billedmodel

En fortrænet billedmodel er et neuralt netværk, der er blevet trænet på en stor billeddatabase (f.eks. ImageNet) og derefter genbruges eller finjusteres til specifikke opgaver inden for computer vision.

Kort fortalt

En fortrænet billedmodel er som en allerede uddannet computer, der kan genkende objekter i billeder, og som du kan tilpasse til dine egne billedopgaver uden at starte forfra.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    Et neuralt netværk, der er blevet trænet på en stor, generisk billeddatabase (som ImageNet) og derpå anvendes som udgangspunkt for andre opgaver via transfer learning.

    • Ved at bruge en fortrænet billedmodel som ResNet kan vi opnå høj klassifikationsnøjagtighed på vores eget datasæt med blot få epokers finjustering.forskningsartikel, 2023
    • De fleste moderne computer vision-systemer bygger på fortrænede billedmodeller, der er frigivet af forskningsgrupper og virksomheder.forskningsartikel, 2022

Hvornår bruges det

Fortrænede billedmodeller anvendes typisk inden for transfer learning, hvor man tager en model trænet på en stor generisk database (som ImageNet) og finjusterer den på en mindre, opgavespecifik database. Dette sparer tid og beregningsressourcer og forbedrer ofte ydeevnen, især når mængden af træningsdata er begrænset.

Kodeeksempel

import torch
import torchvision.models as models

# Load a pre-trained ResNet-18 model
model = models.resnet18(pretrained=True)

# Freeze all layers except the final classification layer
for param in model.parameters():
    param.requires_grad = False

# Replace the final layer for a new task (e.g., 10 classes)
num_ftrs = model.fc.in_features
model.fc = torch.nn.Linear(num_ftrs, 10)

# Now the model is ready for fine-tuning on your dataset

Eksempel på indlæsning af en fortrænet ResNet-18-model fra torchvision, frysning af vægte og tilpasning til en ny klassifikationsopgave.

Oprindelse

Termen 'fortrænet billedmodel' er sammensat af 'fortrænet' (engelsk 'pre-trained') og 'billedmodel' (engelsk 'image model'), en direkte oversættelse fra engelsk.

Afledte ord

2

Kilder

2
  • ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)
  • Deep Residual Learning for Image Recognition (He et al., 2016)