UMAP
forkortelse for Uniform Manifold Approximation and Projection
UMAP er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til visualisering og klustering af højdimensionelle data.
Kort fortalt
UMAP gør det muligt at se komplekse, højdimensionelle data i 2D eller 3D, samtidig med at den bevarer både lokale og globale strukturer.
- Kategori
- teknik
- Niveau
- øvet
- Udtale
- /ˈjuːmæp/
Betydninger
1- 1
En algoritme for ikke-lineær dimensionalitetsreduktion, der konstruerer en grafbaseret repræsentation af data og optimerer en lavdimensionel indlejring bevarende topologisk struktur.
- UMAP-reduktionen viste tydelige klynger i enkeltcellet RNA-seq data.
- Vi anvendte UMAP til at visualisere 1000-dimensionelle ordindlejringer i 2D.
Hvornår bruges det
UMAP anvendes primært til datavisualisering, især inden for bioinformatik og maskinlæring, til at identificere klynger og mønstre i store datasæt. Det fungerer ved at konstruere en graf over nærmeste naboer i høj dimension og derefter optimere en lavdimensionel indlejring, der bevarer denne grafstruktur.
Kodeeksempel
import umap
reducer = umap.UMAP(n_neighbors=15, min_dist=0.1)
embedding = reducer.fit_transform(data)UMAP-implementering i Python med biblioteket umap-learn.
Oprindelse
UMAP er udviklet af Leland McInnes, John Healy og James Melville i 2018 som en forbedring af t-SNE.