Python ML for Healthcare Data

Uploaded by

umadataengg

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

39 views3 pages

Python ML for Healthcare Data

Uploaded by

umadataengg

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

Here’s an alternative Python code example that showcases a different approach to

data handling, preprocessing, and visualization for a healthcare-related machine

learning task. This example uses a synthetic dataset, applies different
preprocessing techniques, and implements a logistic regression model.

Alternative Python Code Example

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score
import seaborn as sns

# Sample dataset generation

np.random.seed(42)
data_size = 1000

# Creating a DataFrame with synthetic data

data = {
'age': np.random.randint(20, 80, data_size),
'gender': np.random.choice(['Male', 'Female'], data_size),
'blood_pressure': np.random.randint(80, 180, data_size),
'cholesterol': np.random.randint(150, 300, data_size),
'outcome': np.random.choice([0, 1], data_size) # 0: No Disease, 1: Disease
}

df = pd.DataFrame(data)

# Display the first few rows of the dataset

print("Dataset Preview:")
print(df.head())

# Data Preprocessing
# Convert categorical variable 'gender' to numeric
label_encoder = LabelEncoder()
df['gender'] = label_encoder.fit_transform(df['gender']) # Male: 0, Female: 1

# Handling missing values (if any)

df.fillna(df.mean(), inplace=True)

# Splitting the data into features and target variable

X = df[['age', 'gender', 'blood_pressure', 'cholesterol']]
y = df['outcome']

# Splitting the dataset into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Feature Scaling
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Model Development: Logistic Regression

model = LogisticRegression(random_state=42)
model.fit(X_train, y_train)
# Model Evaluation
y_pred = model.predict(X_test)

# Performance Metrics
print("Accuracy Score:", accuracy_score(y_test, y_pred))
print("\nClassification Report:\n", classification_report(y_test, y_pred))

# Confusion Matrix
conf_matrix = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Greens', xticklabels=['No
Disease', 'Disease'], yticklabels=['No Disease', 'Disease'])
plt.title('Confusion Matrix')
plt.ylabel('Actual')
plt.xlabel('Predicted')
plt.show()

# Visualizing the dataset distribution

plt.figure(figsize=(10, 6))
sns.countplot(data=df, x='outcome', palette='pastel')
plt.title('Distribution of Disease Outcome')
plt.xlabel('Disease Outcome (0: No, 1: Yes)')
plt.ylabel('Count')
plt.show()

# Additional visualization: Age distribution by outcome

plt.figure(figsize=(10, 6))
sns.boxplot(x='outcome', y='age', data=df, palette='Set2')
plt.title('Age Distribution by Disease Outcome')
plt.xlabel('Disease Outcome (0: No, 1: Yes)')
plt.ylabel('Age')
plt.show()

Explanation of the Code

Dataset Generation: Similar to the previous example, a synthetic healthcare dataset
is generated with features such as age, gender, blood_pressure, and cholesterol,
along with a binary outcome.

Data Preprocessing:

The categorical variable gender is converted into numeric format using Label
Encoding.
Missing values are handled by filling them with the mean of the respective columns.
Splitting the Data: The dataset is divided into features (X) and target variable
(y), then further split into training and testing sets.

Feature Scaling: The features are standardized using StandardScaler to normalize

their distribution.

Model Development: A Logistic Regression model is trained on the training set.

Model Evaluation: The model's performance is evaluated using accuracy score,

classification report, and confusion matrix.

Visualization:
A heatmap of the confusion matrix provides insight into model performance.
A count plot shows the distribution of disease outcomes.
A boxplot visualizes the age distribution for each disease outcome, offering
insights into the relationship between age and health status.
Required Libraries
Ensure you have the necessary libraries installed. Use the following command to
install them if you haven’t already:

pip install numpy pandas matplotlib seaborn scikit-learn

Note
This alternative code showcases a different machine learning approach and
preprocessing techniques. You can further customize it based on your specific
research focus or dataset.

ML Lab: Healthcare Data Analysis
No ratings yet
ML Lab: Healthcare Data Analysis
16 pages
Heart Disease Report With Comments and Code
No ratings yet
Heart Disease Report With Comments and Code
9 pages
Predicting Disease With Machine Learning
No ratings yet
Predicting Disease With Machine Learning
20 pages
Personalized Healthcare Recommendations
No ratings yet
Personalized Healthcare Recommendations
6 pages
Samplecode (HDPS)
No ratings yet
Samplecode (HDPS)
29 pages
Obermeyer Sample
No ratings yet
Obermeyer Sample
8 pages
Python Cod1
No ratings yet
Python Cod1
3 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
Final Project Guidelines: Dataset Selection & Planning
No ratings yet
Final Project Guidelines: Dataset Selection & Planning
3 pages
Diabetes Prediction with Logistic Regression
No ratings yet
Diabetes Prediction with Logistic Regression
9 pages
Phase 2
No ratings yet
Phase 2
6 pages
AI - ML in Heathcare
No ratings yet
AI - ML in Heathcare
15 pages
Bhavan Phase3 Prj.
No ratings yet
Bhavan Phase3 Prj.
24 pages
DW M Final Report
No ratings yet
DW M Final Report
15 pages
Total Documentation
No ratings yet
Total Documentation
21 pages
Ai in HC - 2
No ratings yet
Ai in HC - 2
9 pages
Exploratory Data Analysis Main Concepts
No ratings yet
Exploratory Data Analysis Main Concepts
1 page
Phase 3 Health Monitoring and Diagnosis
No ratings yet
Phase 3 Health Monitoring and Diagnosis
10 pages
Ai ML Exp1
No ratings yet
Ai ML Exp1
8 pages
PROJECTS
No ratings yet
PROJECTS
6 pages
Boo PH 3
No ratings yet
Boo PH 3
11 pages
Heart Disease Report
No ratings yet
Heart Disease Report
8 pages
Healthcare Tutorial
No ratings yet
Healthcare Tutorial
12 pages
Class 14 - Basic Coding in Python - 5
No ratings yet
Class 14 - Basic Coding in Python - 5
24 pages
Heart Disease Prediction System Using Machine Learning 1
No ratings yet
Heart Disease Prediction System Using Machine Learning 1
17 pages
Cse437 4
No ratings yet
Cse437 4
14 pages
Critical Care Data Preprocessing Report Detailed
No ratings yet
Critical Care Data Preprocessing Report Detailed
7 pages
DA 1 (Datamining)
No ratings yet
DA 1 (Datamining)
7 pages
Experiment 5
No ratings yet
Experiment 5
10 pages
Healthcare-Project-Simplilearn - Week3
No ratings yet
Healthcare-Project-Simplilearn - Week3
7 pages
Data Analytics7
No ratings yet
Data Analytics7
5 pages
Machine Learning and Visualization For Healthcare Data Poster
No ratings yet
Machine Learning and Visualization For Healthcare Data Poster
1 page
DS Report 03
No ratings yet
DS Report 03
30 pages
CS 131 Big Data Final Report
No ratings yet
CS 131 Big Data Final Report
15 pages
Thyroid Disease Classification Using ML
No ratings yet
Thyroid Disease Classification Using ML
37 pages
ML Projects Part C
No ratings yet
ML Projects Part C
8 pages
IoT in Hospital Management
No ratings yet
IoT in Hospital Management
7 pages
ML1
No ratings yet
ML1
6 pages
Sample Worksheet 1
No ratings yet
Sample Worksheet 1
8 pages
Hca Unit - 2 Answers
No ratings yet
Hca Unit - 2 Answers
22 pages
ML Lab Manual Completed
No ratings yet
ML Lab Manual Completed
56 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
Disease Detection Machine Learning Model
No ratings yet
Disease Detection Machine Learning Model
10 pages
Project Synopsis - Disease Prediction System Using Multivariate Health Data
No ratings yet
Project Synopsis - Disease Prediction System Using Multivariate Health Data
2 pages
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
No ratings yet
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
7 pages
Natural Language Understanding
No ratings yet
Natural Language Understanding
14 pages
AI P2 (Update)
No ratings yet
AI P2 (Update)
13 pages
Experiment 5
No ratings yet
Experiment 5
9 pages
AIML Practical 05 22105A2021
No ratings yet
AIML Practical 05 22105A2021
9 pages
Logistic Regression for Beginners
No ratings yet
Logistic Regression for Beginners
3 pages
ML Practicals
No ratings yet
ML Practicals
21 pages
Python Project
No ratings yet
Python Project
18 pages
Ass Report
No ratings yet
Ass Report
6 pages
Case Study
No ratings yet
Case Study
21 pages
Python Model
No ratings yet
Python Model
26 pages
Early Detection of Ischemic Heart Disease Through Deep Learning Techniques
No ratings yet
Early Detection of Ischemic Heart Disease Through Deep Learning Techniques
5 pages
3 Storage Building Blocks
No ratings yet
3 Storage Building Blocks
12 pages
1 Azure
No ratings yet
1 Azure
13 pages
Azure Portal Setup Guide
No ratings yet
Azure Portal Setup Guide
18 pages
2 Pandas Series
No ratings yet
2 Pandas Series
1 page
1 Evaluate Performance of Regression and Classifiaction
No ratings yet
1 Evaluate Performance of Regression and Classifiaction
8 pages
4 Urls
No ratings yet
4 Urls
5 pages
0 Introduction
No ratings yet
0 Introduction
17 pages
2 App Creation
No ratings yet
2 App Creation
5 pages
1 Install Django and Django Create Project
No ratings yet
1 Install Django and Django Create Project
12 pages
Paper Structure6
No ratings yet
Paper Structure6
2 pages
Bda Unit 1
No ratings yet
Bda Unit 1
47 pages
STA108 Project 1
100% (3)
STA108 Project 1
27 pages
Budget of Work 1stsem
No ratings yet
Budget of Work 1stsem
6 pages
FPGROWTH
No ratings yet
FPGROWTH
17 pages
Group-16 Project Report
No ratings yet
Group-16 Project Report
27 pages
Design and Implementation of Online Student Registration Portal
80% (5)
Design and Implementation of Online Student Registration Portal
57 pages
Econometric Model Error Detection
No ratings yet
Econometric Model Error Detection
7 pages
نظم المعلومات في المنظمات
No ratings yet
نظم المعلومات في المنظمات
31 pages
Analysis of Service Quality of Private Hospital in Bangladesh
75% (4)
Analysis of Service Quality of Private Hospital in Bangladesh
79 pages
Chapter-24 Multivariate Statistical Analysis
No ratings yet
Chapter-24 Multivariate Statistical Analysis
80 pages
Grievance of Employees Project
63% (8)
Grievance of Employees Project
95 pages
Linear Regression Model: Man - PN@VNP - Edu.vn
No ratings yet
Linear Regression Model: Man - PN@VNP - Edu.vn
77 pages
Questions With Answer
No ratings yet
Questions With Answer
6 pages
Final Report
No ratings yet
Final Report
9 pages
ENC P.B.BSC 2 Unit Nursing Research
100% (1)
ENC P.B.BSC 2 Unit Nursing Research
41 pages
TEN-T Ports & Shipping Analysis 2018
No ratings yet
TEN-T Ports & Shipping Analysis 2018
99 pages
Strategy Analytics Analyst Resume
No ratings yet
Strategy Analytics Analyst Resume
3 pages
Cold Storage Project PDF
0% (1)
Cold Storage Project PDF
10 pages
Teaching Automotive English To Translator and Interpreter Students: Course Design at Zhejiang University of Science and Technology Zhao Hui
No ratings yet
Teaching Automotive English To Translator and Interpreter Students: Course Design at Zhejiang University of Science and Technology Zhao Hui
26 pages
Effects of Sleep Deprivation-Schumacher and Sipes-Final
100% (2)
Effects of Sleep Deprivation-Schumacher and Sipes-Final
55 pages
Chapter 2
No ratings yet
Chapter 2
25 pages
Exploratory Factor Analysis and Cronbach's Alpha: Questionnaire Validation Workshop, 10/10/2017, USM Health Campus
No ratings yet
Exploratory Factor Analysis and Cronbach's Alpha: Questionnaire Validation Workshop, 10/10/2017, USM Health Campus
22 pages
Introduction To Advanced Programming in R: Description
No ratings yet
Introduction To Advanced Programming in R: Description
5 pages
CASE STUDY WALMART - For Merge
100% (1)
CASE STUDY WALMART - For Merge
13 pages
Forecasting
100% (1)
Forecasting
21 pages
Module 3 - Lesson 3.2 Quantitative Data Analysis
No ratings yet
Module 3 - Lesson 3.2 Quantitative Data Analysis
41 pages
Unit 1 Big Data Notes
No ratings yet
Unit 1 Big Data Notes
40 pages
058 1
No ratings yet
058 1
25 pages
UKAI3013 ECommerce JAN22 Assignment Brief ONLY
No ratings yet
UKAI3013 ECommerce JAN22 Assignment Brief ONLY
11 pages
Maintenance in Cement Plants
100% (1)
Maintenance in Cement Plants
11 pages