classification

Classification er en overvåget læringsopgave, hvor modellen forudsiger en kategorisk etiket for en input baseret på trænede klasser.

Kort fortalt

Classification handler om at lære en model at genkende og kategorisere data i foruddefinerede grupper, som at bestemme om en e-mail er spam eller ej.

Kategori
teknik
Niveau
begynder
Udtale
/ˌklæs.ɪ.fɪˈkeɪ.ʃən/

Betydninger

1
  1. 1

    Den overvågede læringsopgave at forudsige en diskret etiket for en given input baseret på et trænet datasæt.

    • Til billedgenkendelse bruger vi et convolutional neural network til classification af objekter.Lærebog i maskinlæring, 2022
    • Binary classification skelner mellem to klasser, som f.eks. spam og ikke-spam.

Hvornår bruges det

Classification bruges i mange praktiske anvendelser såsom billedgenkendelse, spamfiltrering, medicinsk diagnose og sentimentanalyse. Modellen trænes på et mærket datasæt, hvor hvert eksempel har en korrekt klasseetiket. Efter træning kan modellen klassificere nye, usete eksempler.

Kodeeksempel

from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)

Simpelt eksempel på træning af en klassifikationsmodel med scikit-learn.

Oprindelse

Fra latin 'classis' (gruppe) og 'facere' (gøre) – altså 'at danne grupper'.

Afledte ord

3

Kilder

2
  • Pattern Recognition and Machine Learning, Christopher M. Bishop, 2006
  • The Elements of Statistical Learning, Hastie, Tibshirani, Friedman, 2009