ML-pipeline
forkortelse for machine learning pipeline
En ML-pipeline er en struktureret sekvens af databehandlings- og modeltrin, der automatiserer et maskinlærings workflow fra rådata til produktion.
Kort fortalt
En ML-pipeline samler alle trin i et maskinlæringsprojekt – fra data til model – i én automatiseret kæde.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
2- 1
Det konceptuelle workflow, der dækker hele livscyklussen for et maskinlæringsprojekt: dataindsamling, datarensning, feature engineering, modeltræning, evaluering og deployment.
- En ML-pipeline sikrer, at data behandles ens under træning og inferens.
- 2
En konkret softwareimplementering, ofte som en klasse eller et framework, der kæder transformationer og modeller sammen i en sekvens.
- Sklearns Pipeline-klasse gør det let at kombinere en StandardScaler med en SVM-klassifikator.
Hvornår bruges det
ML-pipelines bruges til at automatisere, reproducere og skalere maskinlæringsprocesser. De implementeres ofte med værktøjer som Apache Airflow, Kubeflow eller sklearns Pipeline-klasse til at sikre konsistens og let genanvendelighed.
Kodeeksempel
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
pipeline = Pipeline([
('scaler', StandardScaler()),
('svm', SVC())
])
pipeline.fit(X_train, y_train)Opretter en ML-pipeline med en StandardScaler efterfulgt af en SVM-klassifikator.
Oprindelse
Udtrykket er lånt fra softwareudvikling, hvor en 'pipeline' betegner en række sammenkoblede behandlingstrin. 'ML' står for 'machine learning'.