feature extraction
Feature extraction er processen med at omdanne rådata til et sæt meningsfulde attributter (features), der kan bruges til maskinlæring eller mønstergenkendelse.
Kort fortalt
Feature extraction handler om at finde de vigtigste detaljer i data – ligesom at plukke nøgleinformation ud af en stor bunke.
- Kategori
- teknik
- Niveau
- begynder
- Udtale
- [ˈfiːtʃər ɪkˈstrækʃən]
Betydninger
1- 1
Den generelle proces med at udvælge eller transformere rådata til repræsentative egenskaber, der bevarer relevant information til en given opgave.
- Feature extraction fra billeder ved brug af konvolutionsfiltre er afgørende for genkendelse af objekter. — Litteratur om computer vision
- I lydanalyse anvendes MFCC som en standard metode til feature extraction.
Hvornår bruges det
Feature extraction bruges i maskinlæringspipelines til at reducere dimensionalitet, fjerne støj og forbedre modelpræstation. Det anvendes især inden for billedbehandling (fx kanter, teksturer), naturlig sprogbehandling (fx ordrepræsentationer) og signalbehandling (fx frekvenskomponenter).
Kodeeksempel
from sklearn.decomposition import PCA
import numpy as np
# Simuleret data: 100 prøver, 20 features
X = np.random.rand(100, 20)
# Feature extraction med PCA (reduktion til 5 komponenter)
pca = PCA(n_components=5)
X_reduced = pca.fit_transform(X)
print(X_reduced.shape) # (100, 5)Eksempel på feature extraction ved PCA: reducerer 20 dimensioner til 5 principale komponenter.
Oprindelse
Sammensat af engelsk 'feature' (egenskab/træk) og 'extraction' (udtrækning).
Afledte ord
2Kilder
1- Pattern Recognition and Machine Learning