binary classification

En klassifikationsopgave, hvor output kun kan tilhøre én af to mulige klasser.

Kort fortalt

Binær klassifikation handler om at forudsige et ja/nej-svar eller kategorisere data i to grupper.

Kategori: begreb
Niveau: begynder
Udtale: /ˈbaɪnəri ˌklæsɪfɪˈkeɪʃən/

Betydninger

1
En overvåget læringsopgave, hvor målet er at forudsige en af to diskrete etiketter for hver inputinstans.
- I en binær klassifikationsmodel for e-mails forudsiger modellen, om en e-mail er spam eller ikke-spam.
- Binær klassifikation kan udføres med en logistisk regressionsmodel, der outputter en sandsynlighed mellem 0 og 1.
2
I neurale netværk refererer binær klassifikation til opgaven med at anvende en sigmoid-aktiveringsfunktion på outputlaget for at producere en sandsynlighed, der efterfølgende tærskles til en af to klasser.
- For et neuralt netværk til binær klassifikation bruges typisk binary cross-entropy som tabsfunktion.

Hvornår bruges det

Binær klassifikation bruges i mange praktiske problemstillinger, fx spamdetektion (spam/ikke-spam), medicinsk diagnose (syg/rask) og kreditvurdering (godkendt/afvist). Modeller som logistisk regression, support vector machines og beslutningstræer anvendes ofte til denne opgave.

Kodeeksempel

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=100, n_features=4, random_state=42)
model = LogisticRegression()
model.fit(X, y)
predictions = model.predict(X)

Simpelt eksempel på binær klassifikation med logistisk regression i scikit-learn.

Oprindelse

'Binary' kommer fra latin 'binarius' (bestående af to), og 'classification' fra latin 'classis' (klasse).

Afledte ord

binær klassifikationsmodel binær klassifikator

Kilder

Scikit-learn: Binary Classification

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →