ML-pipeline

forkortelse for machine learning pipeline

En ML-pipeline er en struktureret sekvens af databehandlings- og modeltrin, der automatiserer et maskinlærings workflow fra rådata til produktion.

Kort fortalt

En ML-pipeline samler alle trin i et maskinlæringsprojekt – fra data til model – i én automatiseret kæde.

Kategori: teknik
Niveau: øvet

Betydninger

1
Det konceptuelle workflow, der dækker hele livscyklussen for et maskinlæringsprojekt: dataindsamling, datarensning, feature engineering, modeltræning, evaluering og deployment.
- En ML-pipeline sikrer, at data behandles ens under træning og inferens.
2
En konkret softwareimplementering, ofte som en klasse eller et framework, der kæder transformationer og modeller sammen i en sekvens.
- Sklearns Pipeline-klasse gør det let at kombinere en StandardScaler med en SVM-klassifikator.

Hvornår bruges det

ML-pipelines bruges til at automatisere, reproducere og skalere maskinlæringsprocesser. De implementeres ofte med værktøjer som Apache Airflow, Kubeflow eller sklearns Pipeline-klasse til at sikre konsistens og let genanvendelighed.

Kodeeksempel

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('svm', SVC())
])
pipeline.fit(X_train, y_train)

Opretter en ML-pipeline med en StandardScaler efterfulgt af en SVM-klassifikator.

Oprindelse

Udtrykket er lånt fra softwareudvikling, hvor en 'pipeline' betegner en række sammenkoblede behandlingstrin. 'ML' står for 'machine learning'.

Afledte ord

træningspipeline inferenspipeline orchestreringspipeline

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →