scikit-learn
Scikit-learn er et open-source Python-bibliotek til maskinlæring, bygget på NumPy, SciPy og matplotlib.
Kort fortalt
Et gratis og brugervenligt Python-bibliotek, der gør maskinlæring tilgængeligt for alle med værktøjer til klassifikation, regression, clustering og mere.
- Kategori
- værktøj
- Niveau
- begynder
- Udtale
- /ˈsaɪkɪt lɜːrn/
Betydninger
1- 1
Et open-source Python-bibliotek til maskinlæring, der tilbyder en ensartet grænseflade til klassifikation, regression, clustering, dimensionalitetsreduktion og model-evaluering.
- Vi brugte scikit-learns RandomForestClassifier til at forudsige kundeomsætning baseret på historiske data. — opdigtet eksempel
- Scikit-learns train_test_split-funktion gør det nemt at opdele data i trænings- og testsæt. — opdigtet eksempel
Hvornår bruges det
Scikit-learn bruges i hele maskinlæringspipelinen: fra dataforbehandling (skalering, kodning) over modelvalg (krydsvalidering, hyperparameteroptimering) til evaluering (metrikker som præcision og recall). Det er standardværktøjet for både begyndere og professionelle til hurtig prototyping.
Kodeeksempel
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
clf = RandomForestClassifier()
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
print(accuracy_score(y_test, y_pred))Et klassisk eksempel på at træne en Random Forest-klassifikator, forudsige og evaluere nøjagtigheden.
Oprindelse
Navnet 'scikit-learn' kommer fra 'SciPy Toolkit' (scikit) kombineret med 'learn' for maskinlæring. Det blev lanceret i 2007 som et Google Summer of Code-projekt af David Cournapeau.