billedklassifikation
Billedklassifikation er opgaven med at tildele en foruddefineret kategori til et inputbillede ved hjælp af en model.
Kort fortalt
Det handler om at få en computer til at genkende hvad der er på et billede, f.eks. 'kat' eller 'hund'.
- Kategori
- begreb
- Niveau
- begynder
Betydninger
2- 1
Opgaven med at forudsige en klasseetiket for et givet billede baseret på dets visuelle indhold.
- I billedklassifikation trænes en model på et datasæt af mærkede billeder.
- En typisk udfordring i billedklassifikation er at håndtere variation i belysning og perspektiv.
- 2
Anvendelse af dybe neurale netværk, især convolutional neural networks (CNN'er), til at ekstrahere hierarkiske træk fra billeder og foretage klassifikation.
- AlexNet var en af de første dybe CNN'er der opnåede state-of-the-art resultater i billedklassifikation på ImageNet. — AlexNet paper, 2012
- Transfer learning med fortrænede modeller som ResNet er standardpraksis i moderne billedklassifikation.
Hvornår bruges det
Billedklassifikation bruges bredt i computer vision, fx til automatisk sortering af billeder, medicinsk diagnostik (tumordetektion) og selvkørende biler (genkendelse af trafikskilte). Moderne tilgange anvender convolutional neural networks (CNN'er) og vision transformers (ViT).
Kodeeksempel
model = Sequential([
Conv2D(32, (3,3), activation='relu', input_shape=(32,32,3)),
MaxPooling2D(2,2),
Flatten(),
Dense(10, activation='softmax')
])
model.compile(optimizer='adam', loss='categorical_crossentropy')Simpel CNN-model til billedklassifikation på CIFAR-10 datasættet med 10 klasser.
Oprindelse
Sammensat af 'billede' og 'klassifikation', fra latin 'classis' (klasse) og 'facere' (gøre).
Afledte ord
2Kilder
2- ImageNet Classification with Deep Convolutional Neural Networks, Krizhevsky et al., 2012
- Deep Learning (Goodfellow, Bengio, Courville), Chapter 9: Convolutional Networks