scikit-learn

Scikit-learn er et open-source Python-bibliotek til maskinlæring, bygget på NumPy, SciPy og matplotlib.

Kort fortalt

Et gratis og brugervenligt Python-bibliotek, der gør maskinlæring tilgængeligt for alle med værktøjer til klassifikation, regression, clustering og mere.

Kategori
værktøj
Niveau
begynder
Udtale
/ˈsaɪkɪt lɜːrn/

Betydninger

1
  1. 1

    Et open-source Python-bibliotek til maskinlæring, der tilbyder en ensartet grænseflade til klassifikation, regression, clustering, dimensionalitetsreduktion og model-evaluering.

    • Vi brugte scikit-learns RandomForestClassifier til at forudsige kundeomsætning baseret på historiske data.opdigtet eksempel
    • Scikit-learns train_test_split-funktion gør det nemt at opdele data i trænings- og testsæt.opdigtet eksempel

Hvornår bruges det

Scikit-learn bruges i hele maskinlæringspipelinen: fra dataforbehandling (skalering, kodning) over modelvalg (krydsvalidering, hyperparameteroptimering) til evaluering (metrikker som præcision og recall). Det er standardværktøjet for både begyndere og professionelle til hurtig prototyping.

Kodeeksempel

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
clf = RandomForestClassifier()
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
print(accuracy_score(y_test, y_pred))

Et klassisk eksempel på at træne en Random Forest-klassifikator, forudsige og evaluere nøjagtigheden.

Oprindelse

Navnet 'scikit-learn' kommer fra 'SciPy Toolkit' (scikit) kombineret med 'learn' for maskinlæring. Det blev lanceret i 2007 som et Google Summer of Code-projekt af David Cournapeau.

Afledte ord

1

Kilder

2