multi-klasse billedklassifikation
Multi-klasse billedklassifikation er opgaven at tildele et inputbillede én klasseetikette fra et foruddefineret sæt af flere (≥3) kategorier, typisk ved hjælp af en maskinlæringsmodel.
Kort fortalt
Kort fortalt: Træn en model til at genkende præcis én kategori ud af flere mulige, når den ser et billede.
- Kategori
- teknik
- Niveau
- begynder
Betydninger
1- 1
Opgaven at forudsige én enkelt kategori for et billede fra et sæt af flere (≥3) kategorier.
- En multi-klasse billedklassifikationsmodel trænet på CIFAR-10 kan skelne mellem fly, biler, fugle, katte osv.
- I medicinsk billeddiagnostik anvendes multi-klasse klassifikation til at identificere sygdomstyper fra røntgenbilleder.
Hvornår bruges det
Bruges inden for computer vision til automatisk sortering af billeder, f.eks. til diagnose af medicinske scanninger, genkendelse af trafikskilte eller produktkategorisering i e-handel. Modellen trænes på et mærket datasæt og anvender ofte bløde sandsynligheder via softmax til at vælge den mest sandsynlige klasse.
Kodeeksempel
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
model = Sequential([
Conv2D(32, (3,3), activation='relu', input_shape=(32,32,3)),
MaxPooling2D((2,2)),
Flatten(),
Dense(128, activation='relu'),
Dense(10, activation='softmax') # 10 klasser
])
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])Simpel CNN-model til multi-klasse billedklassifikation på CIFAR-10 med 10 klasser og softmax-output.
Oprindelse
Sammensat af 'multi-klasse' (fra latin 'multus' = mange og 'classis' = kategori) og 'billedklassifikation' (dansk for klassificering af billeder).
Afledte ord
3Kilder
2- ImageNet Large Scale Visual Recognition Challenge (Russakovsky et al., 2015)
- ImageNet Classification with Deep Convolutional Neural Networks (Krizhevsky et al., 2012)