0% found this document useful (0 votes)

201 views4 pages

Project 3 - Diabetes Prediction - Ipynb - Colab

Uploaded by

anish.sarawgi5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

201 views4 pages

Project 3 - Diabetes Prediction - Ipynb - Colab

Uploaded by

anish.sarawgi5

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

11/28/24, 10:18 PM Project 3 - Diabetes Prediction.

ipynb - Colab

Importing the Dependencies

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn.metrics import accuracy_score

Data Collection and Analysis

PIMA Diabetes Dataset

# loading the diabetes dataset to a pandas DataFrame

diabetes_dataset = pd.read_csv('/content/diabetes.csv')

pd.read_csv?

# printing the first 5 rows of the dataset

diabetes_dataset.head()

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age Outcome

0 6 148 72 35 0 33.6 0.627 50 1

1 1 85 66 29 0 26.6 0.351 31 0

2 8 183 64 0 0 23.3 0.672 32 1

3 1 89 66 23 94 28.1 0.167 21 0

4 0 137 40 35 168 43.1 2.288 33 1

# number of rows and Columns in this dataset

diabetes_dataset.shape

(768, 9)

# getting the statistical measures of the data

diabetes_dataset.describe()

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age Outcome

count 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000

mean 3.845052 120.894531 69.105469 20.536458 79.799479 31.992578 0.471876 33.240885 0.348958

std 3.369578 31.972618 19.355807 15.952218 115.244002 7.884160 0.331329 11.760232 0.476951

min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.078000 21.000000 0.000000

25% 1.000000 99.000000 62.000000 0.000000 0.000000 27.300000 0.243750 24.000000 0.000000

50% 3.000000 117.000000 72.000000 23.000000 30.500000 32.000000 0.372500 29.000000 0.000000

75% 6.000000 140.250000 80.000000 32.000000 127.250000 36.600000 0.626250 41.000000 1.000000

max 17.000000 199.000000 122.000000 99.000000 846.000000 67.100000 2.420000 81.000000 1.000000

diabetes_dataset['Outcome'].value_counts()

0 500
1 268
Name: Outcome, dtype: int64

0 --> Non-Diabetic

1 --> Diabetic

diabetes_dataset.groupby('Outcome').mean()

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 1/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age

Outcome

0 3.298000 109.980000 68.184000 19.664000 68.792000 30.304200 0.429734 31.190000

1 4.865672 141.257463 70.824627 22.164179 100.335821 35.142537 0.550500 37.067164

# separating the data and labels

X = diabetes_dataset.drop(columns = 'Outcome', axis=1)
Y = diabetes_dataset['Outcome']

print(X)

Pregnancies Glucose BloodPressure ... BMI DiabetesPedigreeFunction Age

0 6 148 72 ... 33.6 0.627 50
1 1 85 66 ... 26.6 0.351 31
2 8 183 64 ... 23.3 0.672 32
3 1 89 66 ... 28.1 0.167 21
4 0 137 40 ... 43.1 2.288 33
.. ... ... ... ... ... ... ...
763 10 101 76 ... 32.9 0.171 63
764 2 122 70 ... 36.8 0.340 27
765 5 121 72 ... 26.2 0.245 30
766 1 126 60 ... 30.1 0.349 47
767 1 93 70 ... 30.4 0.315 23

[768 rows x 8 columns]

print(Y)

0 1
1 0
2 1
3 0
4 1
..
763 0
764 0
765 0
766 1
767 0
Name: Outcome, Length: 768, dtype: int64

Data Standardization

scaler = StandardScaler()

scaler.fit(X)

StandardScaler(copy=True, with_mean=True, with_std=True)

standardized_data = scaler.transform(X)

print(standardized_data)

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

1.4259954 ]
[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078
-0.19067191]
[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732
-0.10558415]
...
[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336
-0.27575966]
[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101
1.17073215]
[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505
-0.87137393]]

X = standardized_data
Y = diabetes_dataset['Outcome']

print(X)
print(Y)

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

1.4259954 ]

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 2/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab
[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078
-0.19067191]
[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732
-0.10558415]
...
[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336
-0.27575966]
[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101
1.17073215]
[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505
-0.87137393]]
0 1
1 0
2 1
3 0
4 1
..
763 0
764 0
765 0
766 1
767 0
Name: Outcome, Length: 768, dtype: int64

Train Test Split

X_train, X_test, Y_train, Y_test = train_test_split(X,Y, test_size = 0.2, stratify=Y, random_state=2)

print(X.shape, X_train.shape, X_test.shape)

(768, 8) (614, 8) (154, 8)

Training the Model

classifier = svm.SVC(kernel='linear')

#training the support vector Machine Classifier

classifier.fit(X_train, Y_train)

SVC(C=1.0, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,

decision_function_shape='ovr', degree=3, gamma='scale', kernel='linear',
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)

Model Evaluation

Accuracy Score

# accuracy score on the training data

X_train_prediction = classifier.predict(X_train)
training_data_accuracy = accuracy_score(X_train_prediction, Y_train)

print('Accuracy score of the training data : ', training_data_accuracy)

Accuracy score of the training data : 0.7866449511400652

# accuracy score on the test data

X_test_prediction = classifier.predict(X_test)
test_data_accuracy = accuracy_score(X_test_prediction, Y_test)

print('Accuracy score of the test data : ', test_data_accuracy)

Accuracy score of the test data : 0.7727272727272727

Making a Predictive System

input_data = (5,166,72,19,175,25.8,0.587,51)

# changing the input_data to numpy array

input_data_as_numpy_array = np.asarray(input_data)

# reshape the array as we are predicting for one instance

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 3/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab
input_data_reshaped = input_data_as_numpy_array.reshape(1,-1)

# standardize the input data

std_data = scaler.transform(input_data_reshaped)
print(std_data)

prediction = classifier.predict(std_data)
print(prediction)

if (prediction[0] == 0):
print('The person is not diabetic')
else:
print('The person is diabetic')

[[ 0.3429808 1.41167241 0.14964075 -0.09637905 0.82661621 -0.78595734

0.34768723 1.51108316]]
[1]
The person is diabetic

Start coding or generate with AI.

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 4/4

Diabetis Project
No ratings yet
Diabetis Project
7 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
7 pages
Diabetes Dataset Analysis & Prep
No ratings yet
Diabetes Dataset Analysis & Prep
11 pages
Pima Indian Diabetes Prediction
No ratings yet
Pima Indian Diabetes Prediction
22 pages
Diabetes Data Analysis & Outlier Removal
No ratings yet
Diabetes Data Analysis & Outlier Removal
16 pages
Week-01 B
No ratings yet
Week-01 B
4 pages
Python 2025
No ratings yet
Python 2025
25 pages
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
No ratings yet
Import As From Import From Import From Import From Import From Import From Import From Import From Import From Import From Import Import As
8 pages
Exp 5
No ratings yet
Exp 5
7 pages
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
12 pages
Data Science Practical 9
No ratings yet
Data Science Practical 9
6 pages
KNN For Classification
No ratings yet
KNN For Classification
4 pages
Project 16 Calories Burnt Prediction
No ratings yet
Project 16 Calories Burnt Prediction
10 pages
Fds 1
No ratings yet
Fds 1
44 pages
Prashant ML Tree Okay
No ratings yet
Prashant ML Tree Okay
8 pages
Pima Indian Diabetes Questions
No ratings yet
Pima Indian Diabetes Questions
6 pages
Practical 4
No ratings yet
Practical 4
2 pages
ML Lab Manual-Iso
No ratings yet
ML Lab Manual-Iso
40 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
5 pages
Diabetes Prediction Analysis
No ratings yet
Diabetes Prediction Analysis
5 pages
ADS Exp-1
No ratings yet
ADS Exp-1
3 pages
Stroke Prediction
No ratings yet
Stroke Prediction
10 pages
Data Pre-Processing
No ratings yet
Data Pre-Processing
22 pages
Data Perparation Penting
No ratings yet
Data Perparation Penting
12 pages
Diabetes Prediction Model Guide
No ratings yet
Diabetes Prediction Model Guide
20 pages
Linear and Multilinear Regression
No ratings yet
Linear and Multilinear Regression
5 pages
6034 Logistic Regression
No ratings yet
6034 Logistic Regression
6 pages
ML Practical 3D
No ratings yet
ML Practical 3D
4 pages
Major Project - Colab
No ratings yet
Major Project - Colab
15 pages
Fds Mannual
No ratings yet
Fds Mannual
39 pages
Lab3 (Main) .Ipynb - Colab
No ratings yet
Lab3 (Main) .Ipynb - Colab
1 page
Assignment 5 - SourceCode - Ipynb - Colab
No ratings yet
Assignment 5 - SourceCode - Ipynb - Colab
4 pages
Logistic - Ipynb - Colaboratory
No ratings yet
Logistic - Ipynb - Colaboratory
6 pages
Decision Tree PBEL With GridSearchCV
No ratings yet
Decision Tree PBEL With GridSearchCV
12 pages
ML Practical 04
No ratings yet
ML Practical 04
20 pages
Model2.ipynb - Colab
No ratings yet
Model2.ipynb - Colab
11 pages
Diabetes Prediction with KNN Model
No ratings yet
Diabetes Prediction with KNN Model
12 pages
RA2111003011432
No ratings yet
RA2111003011432
3 pages
AIML Report (1) 11
No ratings yet
AIML Report (1) 11
13 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
Baseline - Ipynb - Colab
No ratings yet
Baseline - Ipynb - Colab
5 pages
Prashant ML Tree
No ratings yet
Prashant ML Tree
2 pages
Openlab 1
No ratings yet
Openlab 1
17 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
7 pages
ML Data Preprocessing in Python
No ratings yet
ML Data Preprocessing in Python
9 pages
Scikit-Learn for Data Scientists
No ratings yet
Scikit-Learn for Data Scientists
32 pages
Aiml Experiment 6
No ratings yet
Aiml Experiment 6
1 page
Preprocessing1.ipynb - Colab
No ratings yet
Preprocessing1.ipynb - Colab
13 pages
Labpg3.ipynb - Colab
No ratings yet
Labpg3.ipynb - Colab
2 pages
Data Pre Processing 1
No ratings yet
Data Pre Processing 1
35 pages
4.4. Data Standardization - Ipynb - Colaboratory
No ratings yet
4.4. Data Standardization - Ipynb - Colaboratory
1 page
lab - 8 - - (6) عفان عبدالله احمد - التكليف -
No ratings yet
lab - 8 - - (6) عفان عبدالله احمد - التكليف -
18 pages
Bio-Signal Analysis For Smoking
No ratings yet
Bio-Signal Analysis For Smoking
1 page
ML Manual Final
No ratings yet
ML Manual Final
35 pages
Pandas Ds
No ratings yet
Pandas Ds
18 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
ML Proj Diabetes
No ratings yet
ML Proj Diabetes
51 pages
Brother XL 3027 Owner S Manual
No ratings yet
Brother XL 3027 Owner S Manual
224 pages
GSM Gate Opener GSM Remote Switch
No ratings yet
GSM Gate Opener GSM Remote Switch
13 pages
Lp140wh2 Tle2 LG
No ratings yet
Lp140wh2 Tle2 LG
27 pages
Liz: I Am Afraid That I Am Putting On Weight. - Tony
No ratings yet
Liz: I Am Afraid That I Am Putting On Weight. - Tony
6 pages
Risc & Sisc Characteristics
No ratings yet
Risc & Sisc Characteristics
9 pages
Manish Dalal - Docx000002 26.11.23 - Last Edited
No ratings yet
Manish Dalal - Docx000002 26.11.23 - Last Edited
68 pages
Karanresume PDF
No ratings yet
Karanresume PDF
1 page
Onkyo TX NR 616 Service Manual PDF
No ratings yet
Onkyo TX NR 616 Service Manual PDF
138 pages
Chapter5 Probability
No ratings yet
Chapter5 Probability
31 pages
VPN Connection Guide + Troubleshooting - PUBLIC
No ratings yet
VPN Connection Guide + Troubleshooting - PUBLIC
12 pages
Intersight Essentials Licensing
No ratings yet
Intersight Essentials Licensing
14 pages
Test Bank For Modern Business Statistics With Microsoft Excel, 6th Edition, David R. Anderson, Dennis J. Sweeney, Thomas A. Williams, Jeffrey D. Camm James J. Cochran PDF Download
100% (5)
Test Bank For Modern Business Statistics With Microsoft Excel, 6th Edition, David R. Anderson, Dennis J. Sweeney, Thomas A. Williams, Jeffrey D. Camm James J. Cochran PDF Download
60 pages
Enterprise Architecture: Dexter C. Hulleza
No ratings yet
Enterprise Architecture: Dexter C. Hulleza
28 pages
Java Chat App Development Report
No ratings yet
Java Chat App Development Report
12 pages
Blue Light Blue Color Blocks Flight Attendant CV
No ratings yet
Blue Light Blue Color Blocks Flight Attendant CV
2 pages
Mayuri
No ratings yet
Mayuri
71 pages
Datasheet - How USM Anywhere Delivers Optimal Threat Detection With Fewer Rules
No ratings yet
Datasheet - How USM Anywhere Delivers Optimal Threat Detection With Fewer Rules
2 pages
A Quality Plan Template - BCIT 2019-02-14 Improved and ACI
No ratings yet
A Quality Plan Template - BCIT 2019-02-14 Improved and ACI
122 pages
Haskell Exercises Solutions
No ratings yet
Haskell Exercises Solutions
6 pages
Heart Cancer Prediction Using Machine Learning
No ratings yet
Heart Cancer Prediction Using Machine Learning
33 pages
Ijst 2021 1266
No ratings yet
Ijst 2021 1266
15 pages
Ram Sequential Atpg
No ratings yet
Ram Sequential Atpg
14 pages
Class 9 Update Syllabus
No ratings yet
Class 9 Update Syllabus
13 pages
Indicator SNR + ICT HTF Candles With FVG For TradingView
100% (1)
Indicator SNR + ICT HTF Candles With FVG For TradingView
23 pages
Recursion Notes !!
No ratings yet
Recursion Notes !!
2 pages
PSM Wiring Harnesspdf PDF Free
No ratings yet
PSM Wiring Harnesspdf PDF Free
271 pages
Class A4 TTS Sound Manual
No ratings yet
Class A4 TTS Sound Manual
2 pages
Speedtronic® Mark V Turbine Control System
100% (2)
Speedtronic® Mark V Turbine Control System
67 pages
English Learning Exercises
No ratings yet
English Learning Exercises
2 pages
Computer Programming 1 Bachelor of Science in Information Technology
No ratings yet
Computer Programming 1 Bachelor of Science in Information Technology
1 page