0% found this document useful (0 votes)

7 views4 pages

AIML Project

The document outlines a data analysis project using a wine quality dataset, where various machine learning models such as Linear Regression, Logistic Regression, KNN, and Naive Bayes are implemented. It includes steps for data preprocessing, feature-target separation, model training, and performance evaluation through metrics like accuracy and R² scores. A summary table is provided at the end to compare the performance of the different models.

Uploaded by

majen24982

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views4 pages

AIML Project

Uploaded by

majen24982

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Project 05/04/25, 5:47 PM

In [1]: import numpy as np

import pandas as pd
import matplotlib.pyplot as plt

In [2]: data = pd.read_csv('/Users/devanshdeepgupta/Downloads/winequality-red.csv')

data.head()

Out[2]: free total

fixed volatile citric residual
chlorides sulfur sulfur density pH
acidity acidity acid sugar
dioxide dioxide

0 7.4 0.70 0.00 1.9 0.076 11.0 34.0 0.9978 3.51

1 7.8 0.88 0.00 2.6 0.098 25.0 67.0 0.9968 3.20

2 7.8 0.76 0.04 2.3 0.092 15.0 54.0 0.9970 3.26

3 11.2 0.28 0.56 1.9 0.075 17.0 60.0 0.9980 3.16

4 7.4 0.70 0.00 1.9 0.076 11.0 34.0 0.9978 3.51

In [3]: print(data.dtypes)

fixed acidity float64

volatile acidity float64
citric acid float64
residual sugar float64
chlorides float64
free sulfur dioxide float64
total sulfur dioxide float64
density float64
pH float64
sulphates float64
alcohol float64
quality int64
dtype: object

Feature-target separation
In [5]: target_col = 'quality'
features = data.drop(columns=[target_col]).values
target = data[target_col].values

Train-test split (80-20)

In [7]: split_index = int(0.8 * len(features))
X_train, X_test = features[:split_index], features[split_index:]
y_train, y_test = target[:split_index], target[split_index:]

file:///Users/devanshdeepgupta/Downloads/Project.html Page 1 of 4
Project 05/04/25, 5:47 PM

Standardize features
In [9]: mean_vals = X_train.mean(axis=0)
std_vals = X_train.std(axis=0)
std_vals[std_vals == 0] = 1e-6 # Avoid divide-by-zero
X_train_norm = (X_train - mean_vals) / std_vals
X_test_norm = (X_test - mean_vals) / std_vals
X_test_bias = np.hstack((np.ones((X_test.shape[0], 1)), X_test_norm))

Linear Regression
In [11]: def train_linear(X, y):
X_bias = np.hstack((np.ones((X.shape[0], 1)), X))
return np.linalg.pinv(X_bias.T @ X_bias) @ X_bias.T @ y

theta_lin = train_linear(X_train_norm, y_train)

y_pred_lin = X_test_bias @ theta_lin
mse_lin = np.mean((y_test - y_pred_lin) ** 2)
r2_lin = 1 - np.sum((y_test - y_pred_lin) ** 2) / np.sum((y_test - y_test.me

Binary classification for quality >= 6

In [13]: y_binary = (target >= 6).astype(int)
y_train_bin = y_binary[:split_index]
y_test_bin = y_binary[split_index:]

Logistic Regression
In [15]: def sigmoid(z):
return 1 / (1 + np.exp(-z))

In [16]: def train_logistic(X, y, lr=0.01, epochs=1000):

weights = np.zeros(X.shape[1] + 1)
X_bias = np.hstack((np.ones((X.shape[0], 1)), X))
for _ in range(epochs):
preds = sigmoid(X_bias @ weights)
grad = X_bias.T @ (preds - y) / len(y)
weights -= lr * grad
return weights

In [17]: theta_log = train_logistic(X_train_norm, y_train_bin)

y_pred_log = sigmoid(X_test_bias @ theta_log) >= 0.5
acc_log = np.mean(y_pred_log == y_test_bin)

KNN Classifier
file:///Users/devanshdeepgupta/Downloads/Project.html Page 2 of 4
Project 05/04/25, 5:47 PM

In [19]: def knn_predict(X_train, y_train, X_test, k=5):

y_pred = []
for x in X_test:
dists = np.linalg.norm(X_train - x, axis=1)
top_k = np.argsort(dists)[:k]
top_labels = y_train[top_k]
y_pred.append(np.bincount(top_labels).argmax())
return np.array(y_pred)

In [20]: y_pred_knn = knn_predict(X_train_norm, y_train_bin, X_test_norm, k=5)

acc_knn = np.mean(y_pred_knn == y_test_bin)

Naive Bayes Classifier

In [22]: def train_naive_bayes(X, y):
classes = np.unique(y)
priors = {c: np.mean(y == c) for c in classes}
means = {c: X[y == c].mean(axis=0) for c in classes}
vars_ = {c: np.where(X[y == c].var(axis=0) == 0, 1e-6, X[y == c].var(axi
return classes, priors, means, vars_

In [23]: def predict_naive_bayes(X, classes, priors, means, vars_):

preds = []
for row in X:
scores = {}
for c in classes:
likelihood = -0.5 * np.sum(((row - means[c]) ** 2) / vars_[c])
scores[c] = np.log(priors[c]) + likelihood
preds.append(max(scores, key=scores.get))
return np.array(preds)

In [24]: classes, priors, means, vars_ = train_naive_bayes(X_train_norm, y_train_bin)

y_pred_nb = predict_naive_bayes(X_test_norm, classes, priors, means, vars_)
acc_nb = np.mean(y_pred_nb == y_test_bin)

Multiple Linear Regression (same as

Linear)
In [26]: theta_multi = train_linear(X_train_norm, y_train)
y_pred_multi = X_test_bias @ theta_multi
mse_multi = np.mean((y_test - y_pred_multi) ** 2)
r2_multi = 1 - np.sum((y_test - y_pred_multi) ** 2) / np.sum((y_test - y_tes

Plotting performance
In [28]: models = ["Linear Reg.", "Multi Linear Reg.", "Logistic Reg.", "KNN", "Naive
accuracy = [None, None, acc_log, acc_knn, acc_nb]

file:///Users/devanshdeepgupta/Downloads/Project.html Page 3 of 4
Project 05/04/25, 5:47 PM

r2_scores = [r2_lin, r2_multi, None, None, None]

In [29]: plt.figure(figsize=(10, 5))

plt.bar(models, [a if a else 0 for a in accuracy], label='Accuracy', color='
plt.bar(models, [r if r else 0 for r in r2_scores], label='R² Score', color=
plt.title("Model Performance Comparison")
plt.ylabel("Score")
plt.legend()
plt.tight_layout()
plt.show()

Summary table
In [31]: summary = pd.DataFrame({
"Model": models,
"Accuracy": accuracy,
"MSE": [mse_lin, mse_multi, None, None, None],
"R² Score": r2_scores
})
print(summary)

Model Accuracy MSE R² Score

0 Linear Reg. NaN 0.431522 0.287476
1 Multi Linear Reg. NaN 0.431522 0.287476
2 Logistic Reg. 0.731250 NaN NaN
3 KNN 0.646875 NaN NaN
4 Naive Bayes 0.728125 NaN NaN

In [ ]:

file:///Users/devanshdeepgupta/Downloads/Project.html Page 4 of 4

1
No ratings yet
1
13 pages
Da 012307
No ratings yet
Da 012307
8 pages
Aiml Programs
No ratings yet
Aiml Programs
12 pages
Machine Learning Lab Assignment 1
No ratings yet
Machine Learning Lab Assignment 1
23 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
ML All Projectpdf Removed
No ratings yet
ML All Projectpdf Removed
41 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
ML Codes
No ratings yet
ML Codes
9 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
ML Lab
No ratings yet
ML Lab
10 pages
ML Lab Manual
No ratings yet
ML Lab Manual
17 pages
Medical Data ML
No ratings yet
Medical Data ML
6 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
ML Internal Questions
No ratings yet
ML Internal Questions
15 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
ML Functions
No ratings yet
ML Functions
12 pages
ML Lab
No ratings yet
ML Lab
29 pages
AI&ML
No ratings yet
AI&ML
9 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
21CSC305P ML - Lab Programs 1 - 9
No ratings yet
21CSC305P ML - Lab Programs 1 - 9
36 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
No ratings yet
Importing Libraries: Pandas PD Matplotlib - Pyplot PLT Numpy NP
10 pages
ML PDF
No ratings yet
ML PDF
30 pages
Deep Learning Perceptron
No ratings yet
Deep Learning Perceptron
10 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
ML Assignment
No ratings yet
ML Assignment
34 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Project
No ratings yet
Project
16 pages
Home Work
No ratings yet
Home Work
12 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
ML Manual
No ratings yet
ML Manual
30 pages
Train
No ratings yet
Train
17 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
No ratings yet
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
20 pages
Aml Lab
No ratings yet
Aml Lab
6 pages
Car Evaluation Data Analysis & Random Forest Model
No ratings yet
Car Evaluation Data Analysis & Random Forest Model
12 pages
Btech1007022 Lab5.1
No ratings yet
Btech1007022 Lab5.1
9 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
MLfull
No ratings yet
MLfull
29 pages
ML Manual
No ratings yet
ML Manual
9 pages
ML Manual
No ratings yet
ML Manual
18 pages
Advanced Regression with IPL Data
No ratings yet
Advanced Regression with IPL Data
25 pages
Print Out ML - Finallllllllllllllll
No ratings yet
Print Out ML - Finallllllllllllllll
11 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
ML
No ratings yet
ML
17 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
Group Work Assignment Supervised and Unsupervised Learning
No ratings yet
Group Work Assignment Supervised and Unsupervised Learning
10 pages
Btech1007022 Lab5
No ratings yet
Btech1007022 Lab5
14 pages
Semester-V: 2. Competency
No ratings yet
Semester-V: 2. Competency
8 pages
Class 9 - Important Questions
No ratings yet
Class 9 - Important Questions
13 pages
Bioanalysis-Latest Publication - Chromat. Conditions Method Details
No ratings yet
Bioanalysis-Latest Publication - Chromat. Conditions Method Details
7 pages
Carboxylic Acid: Classification: Based On The Number of COOH Groups
No ratings yet
Carboxylic Acid: Classification: Based On The Number of COOH Groups
7 pages
Experiment 5 Acid and Base Titration 1.1 Objectives: SKU3073 Chemistry Semester 1 2020/2021
No ratings yet
Experiment 5 Acid and Base Titration 1.1 Objectives: SKU3073 Chemistry Semester 1 2020/2021
8 pages
Cambridge IGCSE: Combined Science 0653/21
No ratings yet
Cambridge IGCSE: Combined Science 0653/21
16 pages
Class Xi Chemistry Project Guidelines 2024-25
No ratings yet
Class Xi Chemistry Project Guidelines 2024-25
3 pages
New Biology Booklet ACT
100% (1)
New Biology Booklet ACT
152 pages
Kunal Interview Questions
No ratings yet
Kunal Interview Questions
17 pages
ETEA Mdcat PAPER 2022
No ratings yet
ETEA Mdcat PAPER 2022
30 pages
HYSYS
No ratings yet
HYSYS
390 pages
Some Guidelines To The Design of A Diagnostic Leaching Experiment
No ratings yet
Some Guidelines To The Design of A Diagnostic Leaching Experiment
10 pages
Ammonia Destruction in The Reaction Furnace - Optimized Gas Treating
No ratings yet
Ammonia Destruction in The Reaction Furnace - Optimized Gas Treating
9 pages
Equilibria: Effect of Temperature On Equilibrium
No ratings yet
Equilibria: Effect of Temperature On Equilibrium
9 pages
Nitrogen and Its Compounds Cat 1
No ratings yet
Nitrogen and Its Compounds Cat 1
7 pages
Lab 07 SN1 and SN2 Reactions of Alkyl Halides
No ratings yet
Lab 07 SN1 and SN2 Reactions of Alkyl Halides
12 pages
2025 Physical Sciences ATP Grade 12
No ratings yet
2025 Physical Sciences ATP Grade 12
8 pages
Akopdzhanov 2018
No ratings yet
Akopdzhanov 2018
5 pages
2012 h2 Chemistry PDF
No ratings yet
2012 h2 Chemistry PDF
1,108 pages
Content: Project Based Learning Chemistry Form 4 2020
No ratings yet
Content: Project Based Learning Chemistry Form 4 2020
12 pages
5-Aldehydes Ketones 2019
No ratings yet
5-Aldehydes Ketones 2019
1 page
Solved Chemistry M - J 2025 P33 Predicted Paper - Crack A Level
No ratings yet
Solved Chemistry M - J 2025 P33 Predicted Paper - Crack A Level
35 pages
Hydrolysis Acetanilide.: Univ Rsity
No ratings yet
Hydrolysis Acetanilide.: Univ Rsity
11 pages
Chemistry Exam Practice Questions
No ratings yet
Chemistry Exam Practice Questions
10 pages
Acid Base Equilibrium
No ratings yet
Acid Base Equilibrium
21 pages
Science Workbook 1 Answers PDF
100% (1)
Science Workbook 1 Answers PDF
26 pages
Acid-Base Equilibria Course 2024/25
No ratings yet
Acid-Base Equilibria Course 2024/25
14 pages
Amino Acids & Proteins Lab Guide
No ratings yet
Amino Acids & Proteins Lab Guide
20 pages
Coordination Chemistry Primer
100% (5)
Coordination Chemistry Primer
148 pages
Chemistry Titration and Analysis Guide
No ratings yet
Chemistry Titration and Analysis Guide
41 pages