computer vision-model
En computer vision-model er en maskinlæringsmodel trænet til at fortolke og forstå visuel information fra billeder eller video.
Kort fortalt
En computer vision-model er en AI, der kan 'se' og analysere billeder, f.eks. genkende objekter eller ansigter.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
En maskinlæringsmodel designet til at udføre opgaver relateret til visuel perception, såsom klassifikation, detektering eller segmentering af billeder.
- En computer vision-model kan trænes til at genkende trafikskilte i realtid.
- Virksomheden brugte en computer vision-model til automatisk at inspicere produktkvalitet på samlebåndet.
Hvornår bruges det
Computer vision-modeller anvendes bredt inden for billedgenkendelse, objektdetektering, medicinsk billedanalyse og selvkørende biler. De trænes typisk på store datasæt af annoterede billeder og benytter ofte convolutional neural networks (CNN'er).
Kodeeksempel
import tensorflow as tf
from tensorflow.keras import layers, models
model = models.Sequential([
layers.Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)),
layers.MaxPooling2D((2, 2)),
layers.Conv2D(64, (3, 3), activation='relu'),
layers.MaxPooling2D((2, 2)),
layers.Flatten(),
layers.Dense(64, activation='relu'),
layers.Dense(10, activation='softmax')
])Et simpelt CNN defineret i Keras til billedklassifikation med 10 klasser.
Oprindelse
Termen er en sammensætning af 'computer vision' (fra engelsk, oprindeligt 'computer' og 'vision' fra latin 'visio') og 'model' (fra latin 'modellus').
Afledte ord
1Kilder
2- ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)
- Gradient-Based Learning Applied to Document Recognition (LeCun et al., 1998)