Import As Import As From Import From Import From Import From Import

The document contains Python code for training and evaluating machine learning models on imbalanced datasets, specifically using Logistic Regression and Support Vector Machine (SVM). It includes generating datasets, splitting them into training and testing sets, computing performance metrics like precision, recall, and F1-score, and visualizing results with confusion matrices and precision-recall curves. The code demonstrates the impact of class weighting on model performance and decision thresholds in classification tasks.

Uploaded by

Catherine Shendre

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

23 views4 pages

Import As Import As From Import From Import From Import From Import

Uploaded by

Catherine Shendre

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 4

#Q1)

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import precision_score, recall_score, f1_score,
classification_report, confusion_matrix
# Generate an imbalanced dataset (fraud detection example)
X, y = make_classification(n_samples=5000, n_features=20, n_classes=2,
weights=[0.95, 0.05], flip_y=0.01, random_state=42)
# Split into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)
# Train logistic regression model
model = LogisticRegression()
model.fit(X_train, y_train)
# Make predictions
y_pred = model.predict(X_test)
# Compute Precision, Recall, and F1-score
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
# Display results
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1)
print("\nClassification Report:\n", classification_report(y_test,
y_pred))

Precision: 0.72
Recall: 0.32142857142857145
F1-score: 0.4444444444444444

Classification Report:
precision recall f1-score support

0 0.96 0.99 0.98 944

1 0.72 0.32 0.44 56

accuracy 0.95 1000

macro avg 0.84 0.66 0.71 1000
weighted avg 0.95 0.95 0.95 1000

# Confusion Matrix
cm = confusion_matrix(y_test, y_pred)
print("\nConfusion Matrix:\n", cm)
# Plot Confusion Matrix
import seaborn as sns
plt.figure(figsize=(6,4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=['Not
Fraud', 'Fraud'], yticklabels=['Not Fraud',
'Fraud'])
plt.xlabel("Predicted Label")
plt.ylabel("True Label")
plt.title("Confusion Matrix")
plt.show()

#Q2)
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import precision_recall_curve,
classification_report
# Generate an imbalanced dataset
X, y = make_classification(n_samples=5000, n_features=20, n_classes=2,
weights=[0.9, 0.1], flip_y=0.01, random_state=42)
# Split into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)
# Train Support Vector Machine (SVM) with probability estimation
enabled
svm_model = SVC(kernel='linear', probability=True)
svm_model.fit(X_train, y_train)
# Get predicted probabilities
y_scores = svm_model.predict_proba(X_test)[:, 1]
# Compute Precision-Recall curve
precision, recall, thresholds = precision_recall_curve(y_test,
y_scores)
# Plot Precision-Recall Curve
plt.figure(figsize=(8,6))
plt.plot(recall, precision, marker='.', label="Precision-Recall
Curve")
plt.xlabel("Recall")
plt.ylabel("Precision")
plt.title("Precision-Recall Curve for SVM")
plt.legend()
plt.grid()
plt.show()

# Adjust decision threshold

threshold = 0.5 # You can change this value to observe the effect
y_pred = (y_scores >= threshold).astype(int)
# Print classification report
print(f"\nClassification Report at threshold={threshold}:\n")
print(classification_report(y_test, y_pred))
# Plot Precision & Recall vs Threshold
plt.figure(figsize=(8,6))
plt.plot(thresholds, precision[:-1], label="Precision")
plt.plot(thresholds, recall[:-1], label="Recall")
plt.xlabel("Decision Threshold")
plt.ylabel("Score")
plt.title("Precision and Recall vs Threshold")
plt.legend()
plt.grid()
plt.show()

#Q3)
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import precision_recall_curve,
classification_report, accuracy_score
# Generate an imbalanced dataset (90% class 0, 10% class 1)
X, y = make_classification(n_samples=5000, n_features=20, n_classes=2,
weights=[0.9, 0.1], flip_y=0.01, random_state=42)
# Split data into training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)
# Split data into training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)
# BASELINE MODEL (Without Class Weighting)
logreg_baseline = LogisticRegression(random_state=42)
logreg_baseline.fit(X_train, y_train)
# Predictions
y_pred_baseline = logreg_baseline.predict(X_test)
y_prob_baseline = logreg_baseline.predict_proba(X_test)[:, 1]
# Compute Precision-Recall Curve
precision, recall, _ = precision_recall_curve(y_test, y_prob_baseline)
# Evaluate Baseline Model
print("BASELINE MODEL (Logistic Regression):")
print(f"Accuracy: {accuracy_score(y_test, y_pred_baseline):.4f}")
print(classification_report(y_test, y_pred_baseline))
# Plot Precision-Recall Curve
plt.figure(figsize=(8, 6))
plt.plot(recall, precision, marker='.', label="Baseline Model")
plt.xlabel("Recall")
plt.ylabel("Precision")
plt.title("Precision-Recall Curve for Logistic Regression")
plt.legend()
plt.grid()
plt.show()
# CLASS-WEIGHTED MODEL
logreg_weighted = LogisticRegression(class_weight='balanced',
random_state=42)
logreg_weighted.fit(X_train, y_train)

Import As Import As From Import From Import From Import From Import
No ratings yet
Import As Import As From Import From Import From Import From Import
6 pages
ML Lab Manual
No ratings yet
ML Lab Manual
17 pages
ADS - Phase 3
No ratings yet
ADS - Phase 3
34 pages
Classification
No ratings yet
Classification
3 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
Text Classification with ML Algorithms
No ratings yet
Text Classification with ML Algorithms
5 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
Ai Lab PRGM
No ratings yet
Ai Lab PRGM
10 pages
ML Assignment 4
No ratings yet
ML Assignment 4
7 pages
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 3
No ratings yet
Setup: This Notebook Contains All The Sample Code and Solutions To The Exercises in Chapter 3
30 pages
Naive Bayes Classification
No ratings yet
Naive Bayes Classification
8 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Deep Learningexp4
No ratings yet
Deep Learningexp4
4 pages
Binary Classifier Evaluation Guide
No ratings yet
Binary Classifier Evaluation Guide
12 pages
1
No ratings yet
1
13 pages
Introduction of Phase 4
No ratings yet
Introduction of Phase 4
14 pages
Da 012307
No ratings yet
Da 012307
8 pages
Detect Fake Profiles in Online Social Networks Using Support Vector Machine
No ratings yet
Detect Fake Profiles in Online Social Networks Using Support Vector Machine
8 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Case Study Stock Market Prediciton
No ratings yet
Case Study Stock Market Prediciton
10 pages
ML Internal Answers
No ratings yet
ML Internal Answers
9 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
7 pages
Lab On ML Print-Set-2022
No ratings yet
Lab On ML Print-Set-2022
10 pages
Progress of CATBOOST ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
No ratings yet
Progress of CATBOOST ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
9 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
ML Lab6
No ratings yet
ML Lab6
4 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
ML PDF
No ratings yet
ML PDF
30 pages
ML Prac1-10
No ratings yet
ML Prac1-10
32 pages
ADS Expt5 BE9 29
No ratings yet
ADS Expt5 BE9 29
3 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Loan Default Prediction System 1753830667
No ratings yet
Loan Default Prediction System 1753830667
11 pages
Professional Machine Learning
No ratings yet
Professional Machine Learning
67 pages
Maxbox Starter66 Machine Learning4
No ratings yet
Maxbox Starter66 Machine Learning4
10 pages
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
No ratings yet
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
3 pages
ML Lab 01999676272
No ratings yet
ML Lab 01999676272
12 pages
Print Out ML - Finallllllllllllllll
No ratings yet
Print Out ML - Finallllllllllllllll
11 pages
Sample Code
No ratings yet
Sample Code
9 pages
ML External Xerox
No ratings yet
ML External Xerox
1 page
Code2pdf 67ad4b7f7360e
No ratings yet
Code2pdf 67ad4b7f7360e
2 pages
IRis
No ratings yet
IRis
19 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Import As Import As Import As: "Default - CSV"
No ratings yet
Import As Import As Import As: "Default - CSV"
9 pages
Lab Week 7
No ratings yet
Lab Week 7
3 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Capstone Project - Jaro-Prof. Babji
No ratings yet
Capstone Project - Jaro-Prof. Babji
5 pages
Progress of GRADIENT BOOSTING ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
No ratings yet
Progress of GRADIENT BOOSTING ALGORITHM FOR ELECTRICITY THEFT DETECTION IN POWER UTILITIES
10 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
NNF 03 1910059
No ratings yet
NNF 03 1910059
6 pages
SVM Implementation
No ratings yet
SVM Implementation
8 pages
CCD - Ipynb - Colab
No ratings yet
CCD - Ipynb - Colab
6 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
Telecom Churn Proj
No ratings yet
Telecom Churn Proj
4 pages
TK/KW/15 - 6235 Third Semester Master of Science (M. SC.) Examination
No ratings yet
TK/KW/15 - 6235 Third Semester Master of Science (M. SC.) Examination
3 pages
Revised OGs UFS 2017-22
No ratings yet
Revised OGs UFS 2017-22
9 pages
Unit 3
No ratings yet
Unit 3
13 pages
Survey Methodology and Estimation Procedure
No ratings yet
Survey Methodology and Estimation Procedure
13 pages
Master of Science (M.SC.) Third Semester (Statistics) (CBCS) Examination Decision Theory and Non Parametric Methods Compulsory Paper-1 Paper-I
No ratings yet
Master of Science (M.SC.) Third Semester (Statistics) (CBCS) Examination Decision Theory and Non Parametric Methods Compulsory Paper-1 Paper-I
12 pages
Soda Sales
No ratings yet
Soda Sales
2 pages
Understanding Z-Scores for Students
No ratings yet
Understanding Z-Scores for Students
2 pages
Principal Component Analysis: #Question 1
No ratings yet
Principal Component Analysis: #Question 1
6 pages
Random Forest
No ratings yet
Random Forest
5 pages
Graphic Designer Job PAN India
No ratings yet
Graphic Designer Job PAN India
2 pages
Survival Analysis in R
No ratings yet
Survival Analysis in R
16 pages
Statistics and Probability Exam
100% (1)
Statistics and Probability Exam
2 pages
Homework (Session 5) S5.1
No ratings yet
Homework (Session 5) S5.1
2 pages
Poisson Distribution in R
No ratings yet
Poisson Distribution in R
6 pages
Probability
No ratings yet
Probability
4 pages
Econometrics I: Dummy Variable Regression Models
No ratings yet
Econometrics I: Dummy Variable Regression Models
68 pages
Chap01 Why Study Statistics
No ratings yet
Chap01 Why Study Statistics
13 pages
Nonlinear Curve Fitting Guide
No ratings yet
Nonlinear Curve Fitting Guide
43 pages
Which Test Should I Use (Revised)
No ratings yet
Which Test Should I Use (Revised)
1 page
Percentile Rank
No ratings yet
Percentile Rank
18 pages
MDC Lecture 1 - Anova
No ratings yet
MDC Lecture 1 - Anova
10 pages
Exploring The Limits of Bootstrap
No ratings yet
Exploring The Limits of Bootstrap
458 pages
The Mathematics of Diversification
No ratings yet
The Mathematics of Diversification
32 pages
Chapter 4
No ratings yet
Chapter 4
18 pages
Sampling
No ratings yet
Sampling
12 pages
Albumin Creatinine Ratio
No ratings yet
Albumin Creatinine Ratio
33 pages
Business Statistics Assignment
No ratings yet
Business Statistics Assignment
2 pages
0000 19124-36997-1 - Predator
No ratings yet
0000 19124-36997-1 - Predator
15 pages
Data Analysis for Students
No ratings yet
Data Analysis for Students
5 pages
The Analysis of Variance: I S M T 2002
No ratings yet
The Analysis of Variance: I S M T 2002
31 pages
2024 STAT370 Main Exam Question Paper
No ratings yet
2024 STAT370 Main Exam Question Paper
24 pages
Regression Analysis of Log Dividends
No ratings yet
Regression Analysis of Log Dividends
10 pages
Stata GMM Estimation Guide
100% (1)
Stata GMM Estimation Guide
10 pages
2024.01.20-27 QRM1 - C2 PDF Final
No ratings yet
2024.01.20-27 QRM1 - C2 PDF Final
40 pages
18 AS Statistics and Mechanics Practice Paper I Mark Scheme
No ratings yet
18 AS Statistics and Mechanics Practice Paper I Mark Scheme
8 pages
Survival Analysis
No ratings yet
Survival Analysis
30 pages
Practical Research 2-Module 2
100% (8)
Practical Research 2-Module 2
44 pages
Syllabus
No ratings yet
Syllabus
8 pages
MCQ Testing of Hypothesis With Correct Answers
93% (15)
MCQ Testing of Hypothesis With Correct Answers
7 pages
Regression 3: Medical Supplies Costs A + (B: Summary Output
No ratings yet
Regression 3: Medical Supplies Costs A + (B: Summary Output
2 pages

Import As Import As From Import From Import From Import From Import

Uploaded by

Import As Import As From Import From Import From Import From Import

Uploaded by

#Q1)

0 0.96 0.99 0.98 944

accuracy 0.95 1000

# Adjust decision threshold

You might also like