computer vision-model

En computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.

Kort fortalt

En computer vision-model er en AI, der kan 'se' og analysere billeder, f.eks. genkende objekter eller ansigter.

Kategori: model
Niveau: øvet

Betydninger

1
En maskinlæringsmodel designet til at udføre opgaver relateret til visuel perception, såsom klassifikation, detektering eller segmentering af billeder.
- En computer vision-model kan trænes til at genkende trafikskilte i realtid.
- Virksomheden brugte en computer vision-model til automatisk at inspicere produktkvalitet på samlebåndet.

Hvornår bruges det

Computer vision-modeller anvendes bredt inden for billedgenkendelse, objektdetektering, medicinsk billedanalyse og selvkørende biler. De trænes typisk på store datasæt af annoterede billeder og benytter ofte convolutional neural networks (CNN'er).

Kodeeksempel

import tensorflow as tf
from tensorflow.keras import layers, models

model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

Et simpelt CNN defineret i Keras til billedklassifikation med 10 klasser.

Oprindelse

Termen er en sammensætning af 'computer vision' (fra engelsk, oprindeligt 'computer' og 'vision' fra latin 'visio') og 'model' (fra latin 'modellus').

Afledte ord

computer vision-modeltræning

Kilder

ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)
Gradient-Based Learning Applied to Document Recognition (LeCun et al., 1998)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i model →Tilfældigt opslag →