hierarkisk clustering

Hierarkisk clustering er en metode til at gruppere data i et hierarki af klynger, hvor klyngerne indlejres i hinanden i et dendrogram.

Kort fortalt

Hierarkisk clustering bygger et træ af klynger, så du kan se, hvordan data hænger sammen på forskellige niveauer.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En algoritme der opbygger et hierarki af klynger ved enten at agglomerere (bottom-up) eller splitte (top-down) data.

    • Vi anvendte hierarkisk clustering med Ward's metode for at identificere genetiske undergrupper.forskningsartikel, 2021
    • Dendrogrammet fra den hierarkiske clustering viste tydeligt tre hovedklynger.lærebog, 2020

Hvornår bruges det

Hierarkisk clustering bruges ofte til at analysere komplekse datasæt, hvor antallet af klynger ikke er kendt på forhånd, og hvor der er behov for at forstå strukturen på flere niveauer. Metoden er især nyttig inden for bioinformatik til at gruppere gener eller arter.

Kodeeksempel

from scipy.cluster.hierarchy import dendrogram, linkage
import matplotlib.pyplot as plt
X = [[1,2],[1.5,1.8],[5,8],[8,8],[1,0.6],[9,11]]
Z = linkage(X, method='ward')
dendrogram(Z)
plt.show()

Dette eksempel viser, hvordan man udfører hierarkisk clustering med Ward's metode i Python ved hjælp af SciPy.

Oprindelse

Udtrykket kommer af græsk 'hierarki' (hellig styre) og engelsk 'clustering' (klyngedannelse).

Afledte ord

3

Kilder

2
  • Hierarchical Clustering Schemes
  • Introduction to Data Mining