semi-supervised learning

En maskinlæringsteknik, der kombinerer en lille mængde mærkede data med en stor mængde umærkede data for at træne en model.

Kort fortalt

Semi-supervised learning er en metode, hvor man bruger både få mærkede og mange umærkede data til at træne en model, hvilket er nyttigt når mærkede data er knappe.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En maskinlæringsparadigme, hvor en model trænes på en blanding af mærkede og umærkede data, typisk for at forbedre generaliseringsevnen eller reducere behovet for manuel annotering.

    • Semi-supervised learning kan anvendes til at træne en ansigtsgenkendelsesmodel med kun et par hundrede mærkede billeder og tusindvis af umærkede billeder.Eksempel, 2024
    • Ved at udnytte strukturen i de umærkede data kan semi-supervised learning opnå højere nøjagtighed end supervised learning alene.Eksempel, 2024

Hvornår bruges det

Bruges i situationer, hvor mærkning af data er dyr eller kræver ekspertviden, men umærkede data er let tilgængelige. Eksempler omfatter billedklassifikation, tekstkategorisering og medicinsk diagnose.

Kodeeksempel

import numpy as np
from sklearn.semi_supervised import SelfTrainingClassifier
from sklearn.linear_model import LogisticRegression

# labeled data
X_labeled = np.array([[1, 2], [2, 3], [3, 4]])
y_labeled = np.array([0, 1, 0])
# unlabeled data (labels set to -1)
X_unlabeled = np.array([[4, 5], [5, 6], [6, 7]])
y_unlabeled = np.array([-1, -1, -1])

X = np.vstack([X_labeled, X_unlabeled])
y = np.hstack([y_labeled, y_unlabeled])

model = SelfTrainingClassifier(LogisticRegression())
model.fit(X, y)
print(model.predict([[2.5, 3.5]]))

Eksempel på semi-supervised learning med SelfTrainingClassifier og logistisk regression i scikit-learn.

Oprindelse

Udtrykket opstod i 1990'erne og refererer til en mellemting mellem supervised learning (alene mærkede data) og unsupervised learning (alene umærkede data).

Afledte ord

2

Kilder

2
  • Semi-Supervised Learning Literature Survey (Xiaojin Zhu, 2005)
  • Pseudo-Label: The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks (Lee, 2013)