ML-pipeline

forkortelse for machine learning pipeline

En ML-pipeline er en struktureret sekvens af databehandlings- og modeltrin, der automatiserer et maskinlærings workflow fra rådata til produktion.

Kort fortalt

En ML-pipeline samler alle trin i et maskinlæringsprojekt – fra data til model – i én automatiseret kæde.

Kategori
teknik
Niveau
øvet

Betydninger

2
  1. 1

    Det konceptuelle workflow, der dækker hele livscyklussen for et maskinlæringsprojekt: dataindsamling, datarensning, feature engineering, modeltræning, evaluering og deployment.

    • En ML-pipeline sikrer, at data behandles ens under træning og inferens.
  2. 2

    En konkret softwareimplementering, ofte som en klasse eller et framework, der kæder transformationer og modeller sammen i en sekvens.

    • Sklearns Pipeline-klasse gør det let at kombinere en StandardScaler med en SVM-klassifikator.

Hvornår bruges det

ML-pipelines bruges til at automatisere, reproducere og skalere maskinlæringsprocesser. De implementeres ofte med værktøjer som Apache Airflow, Kubeflow eller sklearns Pipeline-klasse til at sikre konsistens og let genanvendelighed.

Kodeeksempel

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('svm', SVC())
])
pipeline.fit(X_train, y_train)

Opretter en ML-pipeline med en StandardScaler efterfulgt af en SVM-klassifikator.

Oprindelse

Udtrykket er lånt fra softwareudvikling, hvor en 'pipeline' betegner en række sammenkoblede behandlingstrin. 'ML' står for 'machine learning'.

Afledte ord

3

Kilder

3