manifold learning
Manifold learning betegner en klasse af ikke-lineære dimensionalitetsreduktionsmetoder, der antager at højdimensionelle data ligger på eller tæt på en lavdimensionel manifold.
Kort fortalt
Manifold learning er en teknik til at reducere antallet af dimensioner i data ved at finde den underliggende lave struktur, som dataene befinder sig på.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- ˈmænɪˌfoʊld ˈlɜrnɪŋ
Betydninger
1- 1
Den statistiske og geometriske antagelse at naturlige højdimensionelle data ofte ligger på eller nær en lavdimensionel manifold, samt de algoritmer der udnytter denne antagelse til dimensionalitetsreduktion.
- Manifold learning antager at punkter i et 1000-dimensionelt billedrum i virkeligheden ligger på en 10-dimensionel manifold.
- t-SNE er en populær manifold learning-algoritme, der bevarer lokale strukturer i data. — Visualizing Data using t-SNE, 2008
Hvornår bruges det
Manifold learning anvendes typisk til visualisering af højdimensionelle data, forbehandling før klassifikation eller clustering, og til at afdække latente variabler. Metoder som t-SNE og UMAP er populære eksempler.
Kodeeksempel
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
digits = load_digits()
X_embedded = TSNE(n_components=2).fit_transform(digits.data)
plt.scatter(X_embedded[:,0], X_embedded[:,1], c=digits.target, cmap='tab10')
plt.show()Eksempel på t-SNE anvendt på håndskrevne cifre (digits-datasættet) for at visualisere 64-dimensionelle data i 2D.
Oprindelse
Udtrykket 'manifold' kommer fra differentialgeometri, hvor en manifold er et rum der lokalt ligner euklidisk rum. 'Learning' henviser til maskinlæringens evne til at lære strukturen fra data.