dimensionalitetsreduktion

Teknikker til at reducere antallet af variable (dimensioner) i et datasæt, samtidig med at den væsentlige information bevares.

Kort fortalt

En metode til at gøre komplekse data med mange målinger mere overskuelige ved at mindske antallet af egenskaber, uden at miste for meget vigtig information.

Kategori: teknik
Niveau: øvet
Udtale: [dimɛnʃonaliˈteːdsʁedukˌɕoˀn]

Betydninger

1
Proces eller metode til at reducere antallet af tilfældige variable under overvejelse ved at opnå et sæt af principalvariable eller latent struktur.
- Principal Component Analysis (PCA) er den mest anvendte form for dimensionalitetsreduktion. — faglitteratur, 2023
- t-SNE er en ikke-lineær dimensionalitetsreduktionsteknik, der især bruges til visualisering af højdimensionelle data. — forskningsartikel, 2008

Hvornår bruges det

Anvendes i præprocessering af højdimensionelle data, ofte før visualisering eller som input til maskinlæringsmodeller for at undgå 'dimensionernes forbandelse' (curse of dimensionality). Typisk brugt i billedanalyse, tekstmining og genetik.

Kodeeksempel

from sklearn.decomposition import PCA
import numpy as np
# Eksempel: Reducer 10-dimensionelle data til 2 dimensioner
X = np.random.rand(100, 10)
pca = PCA(n_components=2)
X_reduced = pca.fit_transform(X)

Anvendelse af PCA til at reducere 10 dimensioner til 2 i et datasæt med 100 prøver.

Oprindelse

Sammensat af 'dimensionalitet' (fra engelsk 'dimensionality') og 'reduktion' (fra latin 'reductio').

Afledte ord

PCA t-SNE UMAP

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →