computer vision-model

En computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.

Kort fortalt

En computer vision-model er en AI, der kan 'se' og analysere billeder, f.eks. genkende objekter eller ansigter.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    En maskinlæringsmodel designet til at udføre opgaver relateret til visuel perception, såsom klassifikation, detektering eller segmentering af billeder.

    • En computer vision-model kan trænes til at genkende trafikskilte i realtid.
    • Virksomheden brugte en computer vision-model til automatisk at inspicere produktkvalitet på samlebåndet.

Hvornår bruges det

Computer vision-modeller anvendes bredt inden for billedgenkendelse, objektdetektering, medicinsk billedanalyse og selvkørende biler. De trænes typisk på store datasæt af annoterede billeder og benytter ofte convolutional neural networks (CNN'er).

Kodeeksempel

import tensorflow as tf
from tensorflow.keras import layers, models

model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

Et simpelt CNN defineret i Keras til billedklassifikation med 10 klasser.

Oprindelse

Termen er en sammensætning af 'computer vision' (fra engelsk, oprindeligt 'computer' og 'vision' fra latin 'visio') og 'model' (fra latin 'modellus').

Afledte ord

1

Kilder

2
  • ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)
  • Gradient-Based Learning Applied to Document Recognition (LeCun et al., 1998)