manifold learning

Manifold learning betegner en klasse af ikke-lineære dimensionalitetsreduktionsmetoder, der antager at højdimensionelle data ligger på eller tæt på en lavdimensionel manifold.

Kort fortalt

Manifold learning er en teknik til at reducere antallet af dimensioner i data ved at finde den underliggende lave struktur, som dataene befinder sig på.

Kategori
begreb
Niveau
øvet
Udtale
ˈmænɪˌfoʊld ˈlɜrnɪŋ

Betydninger

1
  1. 1

    Den statistiske og geometriske antagelse at naturlige højdimensionelle data ofte ligger på eller nær en lavdimensionel manifold, samt de algoritmer der udnytter denne antagelse til dimensionalitetsreduktion.

    • Manifold learning antager at punkter i et 1000-dimensionelt billedrum i virkeligheden ligger på en 10-dimensionel manifold.
    • t-SNE er en populær manifold learning-algoritme, der bevarer lokale strukturer i data.Visualizing Data using t-SNE, 2008

Hvornår bruges det

Manifold learning anvendes typisk til visualisering af højdimensionelle data, forbehandling før klassifikation eller clustering, og til at afdække latente variabler. Metoder som t-SNE og UMAP er populære eksempler.

Kodeeksempel

from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits

digits = load_digits()
X_embedded = TSNE(n_components=2).fit_transform(digits.data)
plt.scatter(X_embedded[:,0], X_embedded[:,1], c=digits.target, cmap='tab10')
plt.show()

Eksempel på t-SNE anvendt på håndskrevne cifre (digits-datasættet) for at visualisere 64-dimensionelle data i 2D.

Oprindelse

Udtrykket 'manifold' kommer fra differentialgeometri, hvor en manifold er et rum der lokalt ligner euklidisk rum. 'Learning' henviser til maskinlæringens evne til at lære strukturen fra data.

Afledte ord

4

Kilder

3