semi-supervised learning

En maskinlæringsteknik, der kombinerer en lille mængde mærkede data med en stor mængde umærkede data for at træne en model.

Kort fortalt

Semi-supervised learning er en metode, hvor man bruger både få mærkede og mange umærkede data til at træne en model, hvilket er nyttigt når mærkede data er knappe.

Kategori: teknik
Niveau: øvet

Betydninger

1
En maskinlæringsparadigme, hvor en model trænes på en blanding af mærkede og umærkede data, typisk for at forbedre generaliseringsevnen eller reducere behovet for manuel annotering.
- Semi-supervised learning kan anvendes til at træne en ansigtsgenkendelsesmodel med kun et par hundrede mærkede billeder og tusindvis af umærkede billeder. — Eksempel, 2024
- Ved at udnytte strukturen i de umærkede data kan semi-supervised learning opnå højere nøjagtighed end supervised learning alene. — Eksempel, 2024

Hvornår bruges det

Bruges i situationer, hvor mærkning af data er dyr eller kræver ekspertviden, men umærkede data er let tilgængelige. Eksempler omfatter billedklassifikation, tekstkategorisering og medicinsk diagnose.

Kodeeksempel

import numpy as np
from sklearn.semi_supervised import SelfTrainingClassifier
from sklearn.linear_model import LogisticRegression

# labeled data
X_labeled = np.array([[1, 2], [2, 3], [3, 4]])
y_labeled = np.array([0, 1, 0])
# unlabeled data (labels set to -1)
X_unlabeled = np.array([[4, 5], [5, 6], [6, 7]])
y_unlabeled = np.array([-1, -1, -1])

X = np.vstack([X_labeled, X_unlabeled])
y = np.hstack([y_labeled, y_unlabeled])

model = SelfTrainingClassifier(LogisticRegression())
model.fit(X, y)
print(model.predict([[2.5, 3.5]]))

Eksempel på semi-supervised learning med SelfTrainingClassifier og logistisk regression i scikit-learn.

Oprindelse

Udtrykket opstod i 1990'erne og refererer til en mellemting mellem supervised learning (alene mærkede data) og unsupervised learning (alene umærkede data).

Afledte ord

semi-supervised classification semi-supervised clustering

Kilder

Semi-Supervised Learning Literature Survey (Xiaojin Zhu, 2005)
Pseudo-Label: The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks (Lee, 2013)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →