UMAP

forkortelse for Uniform Manifold Approximation and Projection

UMAP er en ikke-lineær dimensionalitetsreduktionsteknik, der bruges til visualisering og klustering af højdimensionelle data.

Kort fortalt

UMAP gør det muligt at se komplekse, højdimensionelle data i 2D eller 3D, samtidig med at den bevarer både lokale og globale strukturer.

Kategori
teknik
Niveau
øvet
Udtale
/ˈjuːmæp/

Betydninger

1
  1. 1

    En algoritme for ikke-lineær dimensionalitetsreduktion, der konstruerer en grafbaseret repræsentation af data og optimerer en lavdimensionel indlejring bevarende topologisk struktur.

    • UMAP-reduktionen viste tydelige klynger i enkeltcellet RNA-seq data.
    • Vi anvendte UMAP til at visualisere 1000-dimensionelle ordindlejringer i 2D.

Hvornår bruges det

UMAP anvendes primært til datavisualisering, især inden for bioinformatik og maskinlæring, til at identificere klynger og mønstre i store datasæt. Det fungerer ved at konstruere en graf over nærmeste naboer i høj dimension og derefter optimere en lavdimensionel indlejring, der bevarer denne grafstruktur.

Kodeeksempel

import umap
reducer = umap.UMAP(n_neighbors=15, min_dist=0.1)
embedding = reducer.fit_transform(data)

UMAP-implementering i Python med biblioteket umap-learn.

Oprindelse

UMAP er udviklet af Leland McInnes, John Healy og James Melville i 2018 som en forbedring af t-SNE.

Kilder

1