0% found this document useful (0 votes)

72 views1 page

Scikit-Learn Cheat Sheet

Uploaded by

ArvindRajVT

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

72 views1 page

Scikit-Learn Cheat Sheet

Uploaded by

ArvindRajVT

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

> Preprocessing The Data > Evaluate Your Model’s Performance

Python For Data Science

Standardization Classification Metrics

Scikit-Learn Cheat Sheet >>>

>>>
>>>
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler().fit(X_train)

standardized_X = scaler.transform(X_train)

Accuracy Score
>>> knn.score(X_test, y_test) #Estimator score method

>>> from sklearn.metrics import accuracy_score #Metric scoring functions

>>> standardized_X_test = scaler.transform(X_test) >>> accuracy_score(y_test, y_pred)

Learn Scikit-Learn online at www.DataCamp.com
Classification Report
Normalization >>> from sklearn.metrics import classification_report #Precision, recall, f1-score and support

>>> print(classification_report(y_test, y_pred))

>>> from sklearn.preprocessing import Normalizer

Confusion Matrix
>>> scaler = Normalizer().fit(X_train)

Scikit-learn >>>
>>>
normalized_X = scaler.transform(X_train)

normalized_X_test = scaler.transform(X_test)
>>> from sklearn.metrics import confusion_matrix

>>> print(confusion_matrix(y_test, y_pred))

Scikit-learn is an open source Python library that implements a range of Binarization Regression Metrics
machine learning, preprocessing, cross-validation and visualization

algorithms using a unified interface. >>> from sklearn.preprocessing import Binarizer

Mean Absolute Error
>>> binarizer = Binarizer(threshold=0.0).fit(X)
>>> from sklearn.metrics import mean_absolute_error

>>> binary_X = binarizer.transform(X)

A Basic Example >>> y_true = [3, -0.5, 2]

>>> mean_absolute_error(y_true, y_pred)

>>> from sklearn import neighbors, datasets, preprocessing

Encoding Categorical Features Mean Squared Error

>>> from sklearn.model_selection import train_test_split
>>> from sklearn.metrics import mean_squared_error

>>> from sklearn.metrics import accuracy_score

>>> from sklearn.preprocessing import LabelEncoder
>>> mean_squared_error(y_test, y_pred)
>>> iris = datasets.load_iris()
>>> enc = LabelEncoder()

>>> X, y = iris.data[:, :2], iris.target

R² Score
>>> y = enc.fit_transform(y)
>>> X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=33)
>>> from sklearn.metrics import r2_score

>>> scaler = preprocessing.StandardScaler().fit(X_train)

>>> r2_score(y_true, y_pred)
>>>
>>>
X_train = scaler.transform(X_train)

X_test = scaler.transform(X_test)

Imputing Missing Values

>>> knn = neighbors.KNeighborsClassifier(n_neighbors=5)

>>> from sklearn.preprocessing import Imputer

Clustering Metrics
>>> knn.fit(X_train, y_train)

>>> y_pred = knn.predict(X_test)

>>> imp = Imputer(missing_values=0, strategy='mean', axis=0)

>>> imp.fit_transform(X_train) Adjusted Rand Index

>>> accuracy_score(y_test, y_pred)
>>> from sklearn.metrics import adjusted_rand_score

Generating Polynomial Features >>> adjusted_rand_score(y_true, y_pred)

> Loading The Data Also see NumPy & Pandas

>>> from sklearn.preprocessing import PolynomialFeatures

Homogeneity

>>> from sklearn.metrics import homogeneity_score

>>> poly = PolynomialFeatures(5)

>>> homogeneity_score(y_true, y_pred)
Your data needs to be numeric and stored as NumPy arrays or SciPy sparse matrices. Other types that are >>> poly.fit_transform(X)
convertible to numeric arrays, such as Pandas DataFrame, are also acceptable. V-measure
>>> import numpy as np
>>> from sklearn.metrics import v_measure_score

> Create Your Model

>>> X = np.random.random((10,5))
>>> metrics.v_measure_score(y_true, y_pred)
>>> y = np.array(['M','M','F','F','M','F','M','M','F','F','F'])

>>> X[X < 0.7] = 0

Cross-Validation
Supervised Learning Estimators
> Training And Test Data Linear Regression
>>> from sklearn.cross_validation import cross_val_score

>>> print(cross_val_score(knn, X_train, y_train, cv=4))

>>> print(cross_val_score(lr, X, y, cv=2))

>>> from sklearn.linear_model import LinearRegression

>>> from sklearn.model_selection import train_test_split

>>> lr = LinearRegression(normalize=True)
>>> X_train, X_test, y_train, y_test = train_test_split(X,

random_state=0)
Support Vector Machines (SVM)
>>> from sklearn.svm import SVC

> Tune Your Model

>>> svc = SVC(kernel='linear')

Grid Search
> Model Fitting
Naive Bayes
>>> from sklearn.naive_bayes import GaussianNB

>>> gnb = GaussianNB() >>> from sklearn.grid_search import GridSearchCV

>>> params = {"n_neighbors": np.arange(1,3),

Supervised learning KNN "metric": ["euclidean", "cityblock"]}

>>> lr.fit(X, y) #Fit the model to the data

>>> from sklearn import neighbors
>>> grid = GridSearchCV(estimator=knn,

>>> knn.fit(X_train, y_train)

>>> knn = neighbors.KNeighborsClassifier(n_neighbors=5) param_grid=params)

>>> svc.fit(X_train, y_train) >>> grid.fit(X_train, y_train)

>>> print(grid.best_score_)

Unsupervised Learning
Unsupervised Learning Estimators >>> print(grid.best_estimator_.n_neighbors)
>>> k_means.fit(X_train) #Fit the model to the data

>>> pca_model = pca.fit_transform(X_train) #Fit to data, then transform it

Principal Component Analysis (PCA) Randomized Parameter Optimization
>>> from sklearn.decomposition import PCA

>>> pca = PCA(n_components=0.95) >>> from sklearn.grid_search import RandomizedSearchCV

> Prediction K Means

>>> params = {"n_neighbors": range(1,5), "weights": ["uniform", "distance"]}

>>> rsearch = RandomizedSearchCV(estimator=knn, param_distributions=params,

>>> from sklearn.cluster import KMeans

cv=4, n_iter=8, random_state=5)

Supervised Estimators >>> k_means = KMeans(n_clusters=3, random_state=0) >>> rsearch.fit(X_train, y_train)

>>> print(rsearch.best_score_)
>>> y_pred = svc.predict(np.random.random((2,5))) #Predict labels

>>> y_pred = lr.predict(X_test) #Predict labels

>>> y_pred = knn.predict_proba(X_test) #Estimate probability of a label

Unsupervised Estimators
Learn Data Skills Online at www.DataCamp.com
>>> y_pred = k_means.predict(X_test) #Predict labels in clustering algos

Scikit-Learn Python Cheat Sheet
No ratings yet
Scikit-Learn Python Cheat Sheet
1 page
Scikit-Learn Python Cheat Sheet
100% (1)
Scikit-Learn Python Cheat Sheet
1 page
Scikit-Learn Python Cheat Sheet
100% (1)
Scikit-Learn Python Cheat Sheet
1 page
Scikit Learn Cheat Sheet Python
No ratings yet
Scikit Learn Cheat Sheet Python
1 page
Python For Data Science Cheat Sheet: Scikit-Learn Create Your Model Evaluate Your Model's Performance
100% (1)
Python For Data Science Cheat Sheet: Scikit-Learn Create Your Model Evaluate Your Model's Performance
1 page
Cheat Sheet: Python For Data Science
100% (1)
Cheat Sheet: Python For Data Science
1 page
Scikit-Learn: Library For Machine Learning and Data Science With Python
100% (1)
Scikit-Learn: Library For Machine Learning and Data Science With Python
11 pages
ML Cheatsheet
No ratings yet
ML Cheatsheet
4 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
20 pages
Python ML Lab for Beginners
No ratings yet
Python ML Lab for Beginners
10 pages
Machine Learning: Supervised /unsupervised
No ratings yet
Machine Learning: Supervised /unsupervised
33 pages
ML Functions
No ratings yet
ML Functions
12 pages
ML Algorithms
100% (1)
ML Algorithms
1 page
Data Preprocessing
No ratings yet
Data Preprocessing
9 pages
Machine Learning Cheatsheet
No ratings yet
Machine Learning Cheatsheet
5 pages
Bi 6 New
No ratings yet
Bi 6 New
6 pages
Scikit Learn
No ratings yet
Scikit Learn
25 pages
Machine Learning Algorithms (Python & R) PDF
No ratings yet
Machine Learning Algorithms (Python & R) PDF
11 pages
Case Study - Classifier
No ratings yet
Case Study - Classifier
5 pages
Machine Learning Evaluation Guide
100% (1)
Machine Learning Evaluation Guide
504 pages
Scikit-Learn Python Cheat Sheet
No ratings yet
Scikit-Learn Python Cheat Sheet
3 pages
Linear Regression: Scikit-Learn
No ratings yet
Linear Regression: Scikit-Learn
3 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Scikit Learn
No ratings yet
Scikit Learn
17 pages
ML Lab Mannual
No ratings yet
ML Lab Mannual
29 pages
Sklearn
No ratings yet
Sklearn
141 pages
ML File - 1
No ratings yet
ML File - 1
12 pages
Machine Learning
No ratings yet
Machine Learning
8 pages
1
No ratings yet
1
13 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Machine Learning Cheat Sheet
No ratings yet
Machine Learning Cheat Sheet
15 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Python Code For KNN Classifier 1. Initial Message
No ratings yet
Python Code For KNN Classifier 1. Initial Message
7 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
Introduction To Scikit Learn
100% (1)
Introduction To Scikit Learn
108 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
8 pages
ML
No ratings yet
ML
11 pages
Python数据科学速查表 - Scikit-Learn
No ratings yet
Python数据科学速查表 - Scikit-Learn
1 page
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
Algorithmeknn 121213175830 Phpapp02
No ratings yet
Algorithmeknn 121213175830 Phpapp02
52 pages
Lab Week 7
No ratings yet
Lab Week 7
3 pages
Dsbda 10
No ratings yet
Dsbda 10
5 pages
Data Science and Machine Learning Practicals
No ratings yet
Data Science and Machine Learning Practicals
8 pages
Lab Manual
No ratings yet
Lab Manual
9 pages
Scikit Learn
No ratings yet
Scikit Learn
10 pages
Prakhar - Week 5
No ratings yet
Prakhar - Week 5
8 pages
Slides (A12 A14)
No ratings yet
Slides (A12 A14)
353 pages
ML Lab Programs 2
No ratings yet
ML Lab Programs 2
16 pages
Supervised Learning with Scikit-Learn
No ratings yet
Supervised Learning with Scikit-Learn
178 pages
Code Examples in Space
No ratings yet
Code Examples in Space
13 pages
Matias Anghileri
100% (1)
Matias Anghileri
32 pages
General Biology 1
No ratings yet
General Biology 1
4 pages
Business Operations Assistant I PDF
No ratings yet
Business Operations Assistant I PDF
2 pages
English Department Writing Levels
No ratings yet
English Department Writing Levels
1 page
PNDA Guidebook 2013
No ratings yet
PNDA Guidebook 2013
26 pages
Microsoft Word - IELTS Task 1 Writing Band Descriptors
100% (1)
Microsoft Word - IELTS Task 1 Writing Band Descriptors
2 pages
English Vocabulary Booster: Family
No ratings yet
English Vocabulary Booster: Family
2 pages
Q8 IM03 Final
100% (1)
Q8 IM03 Final
42 pages
Maintainability of Writ Under Article 32 Conflicting Judgments of Two SC Benches of Co-Equal Strength in Two Weeks Time
100% (1)
Maintainability of Writ Under Article 32 Conflicting Judgments of Two SC Benches of Co-Equal Strength in Two Weeks Time
15 pages
Pain Management in Palliative Care
100% (4)
Pain Management in Palliative Care
22 pages
Ashley Dunns Resume
No ratings yet
Ashley Dunns Resume
4 pages
Introduction To 21st Century Skills and Education
No ratings yet
Introduction To 21st Century Skills and Education
17 pages
Cit333 Summary With Past Questions
No ratings yet
Cit333 Summary With Past Questions
25 pages
LTLO Discussion
No ratings yet
LTLO Discussion
9 pages
Before Crown and Kingdom Melissa Wright Instant Download
No ratings yet
Before Crown and Kingdom Melissa Wright Instant Download
63 pages
Committee/Minstry Head Tasks To Accomplish Deadline Remarks
No ratings yet
Committee/Minstry Head Tasks To Accomplish Deadline Remarks
2 pages
Gamification of Learning
No ratings yet
Gamification of Learning
14 pages
Dangles O. Climate Change On Mountains - Reviving Humboldt's Appr. To Science 2023
No ratings yet
Dangles O. Climate Change On Mountains - Reviving Humboldt's Appr. To Science 2023
276 pages
DLL - Mapeh 3 - Q3 - W3
No ratings yet
DLL - Mapeh 3 - Q3 - W3
3 pages
Future of Work - HR Summit Dr. R. Muh. Deddy Hanif Sardjito, S.Psi., M.Psi.
No ratings yet
Future of Work - HR Summit Dr. R. Muh. Deddy Hanif Sardjito, S.Psi., M.Psi.
37 pages
Work Participation and Return To Work For Workers With Musculoskeletal Disorders A Scoping Review
No ratings yet
Work Participation and Return To Work For Workers With Musculoskeletal Disorders A Scoping Review
15 pages
Z. Int
No ratings yet
Z. Int
168 pages
NY Senate Graduate Fellowship Guide
No ratings yet
NY Senate Graduate Fellowship Guide
2 pages
Policy Insights for Parenting Support
No ratings yet
Policy Insights for Parenting Support
30 pages
Nurture Jee (Main) Mt2 Phase 1+1a On 22 June
No ratings yet
Nurture Jee (Main) Mt2 Phase 1+1a On 22 June
66 pages
Big Words
No ratings yet
Big Words
10 pages
Grade 10 Mathematics - The Midpoint Formula
No ratings yet
Grade 10 Mathematics - The Midpoint Formula
9 pages
De Waal 1997 Are We in Anthropodenial
No ratings yet
De Waal 1997 Are We in Anthropodenial
5 pages
Deepak Kumar Swain
No ratings yet
Deepak Kumar Swain
14 pages
b2 Iesol Practice Paper 1 Exam Paper
No ratings yet
b2 Iesol Practice Paper 1 Exam Paper
17 pages

Scikit-Learn Cheat Sheet

Uploaded by

Scikit-Learn Cheat Sheet

Uploaded by

> Preprocessing The Data > Evaluate Your Model’s Performance

Python For Data Science

Scikit-Learn Cheat Sheet >>>

>>> from sklearn.metrics import accuracy_score #Metric scoring functions

>>> standardized_X_test = scaler.transform(X_test) >>> accuracy_score(y_test, y_pred)

>>> print(classification_report(y_test, y_pred))

>>> print(confusion_matrix(y_test, y_pred))

algorithms using a unified interface. >>> from sklearn.preprocessing import Binarizer

>>> binary_X = binarizer.transform(X)

>>> mean_absolute_error(y_true, y_pred)

>>> from sklearn import neighbors, datasets, preprocessing

Encoding Categorical Features Mean Squared Error

>>> from sklearn.metrics import accuracy_score

>>> X, y = iris.data[:, :2], iris.target

>>> scaler = preprocessing.StandardScaler().fit(X_train)

Imputing Missing Values

>>> from sklearn.preprocessing import Imputer

>>> y_pred = knn.predict(X_test)

>>> imp.fit_transform(X_train) Adjusted Rand Index

Generating Polynomial Features >>> adjusted_rand_score(y_true, y_pred)

> Loading The Data Also see NumPy & Pandas

>>> from sklearn.metrics import homogeneity_score

>>> poly = PolynomialFeatures(5)

> Create Your Model

>>> X[X < 0.7] = 0

>>> print(cross_val_score(knn, X_train, y_train, cv=4))

>>> print(cross_val_score(lr, X, y, cv=2))

>>> from sklearn.model_selection import train_test_split

> Tune Your Model

>>> gnb = GaussianNB() >>> from sklearn.grid_search import GridSearchCV

>>> params = {"n_neighbors": np.arange(1,3),

Supervised learning KNN "metric": ["euclidean", "cityblock"]}

>>> lr.fit(X, y) #Fit the model to the data

>>> knn.fit(X_train, y_train)

>>> svc.fit(X_train, y_train) >>> grid.fit(X_train, y_train)

>>> pca_model = pca.fit_transform(X_train) #Fit to data, then transform it

>>> pca = PCA(n_components=0.95) >>> from sklearn.grid_search import RandomizedSearchCV

> Prediction K Means

>>> rsearch = RandomizedSearchCV(estimator=knn, param_distributions=params,

>>> from sklearn.cluster import KMeans

Supervised Estimators >>> k_means = KMeans(n_clusters=3, random_state=0) >>> rsearch.fit(X_train, y_train)

>>> y_pred = lr.predict(X_test) #Predict labels

>>> y_pred = knn.predict_proba(X_test) #Estimate probability of a label

You might also like