binary classification

En klassifikationsopgave, hvor output kun kan tilhøre én af to mulige klasser.

Kort fortalt

Binær klassifikation handler om at forudsige et ja/nej-svar eller kategorisere data i to grupper.

Kategori
begreb
Niveau
begynder
Udtale
/ˈbaɪnəri ˌklæsɪfɪˈkeɪʃən/

Betydninger

2
  1. 1

    En overvåget læringsopgave, hvor målet er at forudsige en af to diskrete etiketter for hver inputinstans.

    • I en binær klassifikationsmodel for e-mails forudsiger modellen, om en e-mail er spam eller ikke-spam.
    • Binær klassifikation kan udføres med en logistisk regressionsmodel, der outputter en sandsynlighed mellem 0 og 1.
  2. 2

    I neurale netværk refererer binær klassifikation til opgaven med at anvende en sigmoid-aktiveringsfunktion på outputlaget for at producere en sandsynlighed, der efterfølgende tærskles til en af to klasser.

    • For et neuralt netværk til binær klassifikation bruges typisk binary cross-entropy som tabsfunktion.

Hvornår bruges det

Binær klassifikation bruges i mange praktiske problemstillinger, fx spamdetektion (spam/ikke-spam), medicinsk diagnose (syg/rask) og kreditvurdering (godkendt/afvist). Modeller som logistisk regression, support vector machines og beslutningstræer anvendes ofte til denne opgave.

Kodeeksempel

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=100, n_features=4, random_state=42)
model = LogisticRegression()
model.fit(X, y)
predictions = model.predict(X)

Simpelt eksempel på binær klassifikation med logistisk regression i scikit-learn.

Oprindelse

'Binary' kommer fra latin 'binarius' (bestående af to), og 'classification' fra latin 'classis' (klasse).

Afledte ord

2

Kilder

1