0% found this document useful (0 votes)

32 views8 pages

Ass - 10.ipynb - Colab

The document provides a comprehensive analysis of the Iris dataset using Python, covering data loading, statistical feature extraction, normalization, and pattern recognition through machine learning models like K-Nearest Neighbors (KNN) and Support Vector Machine (SVM). It includes visualizations of feature distributions and model evaluation metrics such as accuracy, precision, recall, and F1 score. The KNN model outperformed the SVM model, achieving perfect accuracy and other metrics.

Uploaded by

brotin2503

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

32 views8 pages

Ass - 10.ipynb - Colab

Uploaded by

brotin2503

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Start coding or generate with AI.

Double-click (or enter) to edit

chatgpt

# Import necessary libraries

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris

# Load the Iris dataset from sklearn

iris_sklearn = load_iris()
# Convert to a pandas DataFrame
iris_df = pd.DataFrame(data=iris_sklearn.data, columns=iris_sklearn.feature_names)
# Add the target variable
iris_df['species'] = pd.Categorical.from_codes(iris_sklearn.target, iris_sklearn.target_names)

# Display the first 5 rows of the dataset

print(iris_df.head())

# Identify features and labels

features = iris_df.columns[:-1]
label = iris_df.columns[-1]
print(f"Features: {features}")
print(f"Label: {label}")

# Plot the distribution of each feature using histograms

iris_df[features].hist(figsize=(10, 8))
plt.suptitle('Feature Distributions')
plt.show()

# Visualize the dataset using a scatterplot matrix

sns.pairplot(iris_df, hue='species', markers=["o", "s", "D"])
plt.suptitle('Scatterplot Matrix')
plt.show()
sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) \
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2

species
0 setosa
1 setosa
2 setosa
3 setosa
4 setosa
Features: Index(['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)',
'petal width (cm)'],
dtype='object')
Label: species
# Part 1: Statistical Features and Feature Selection

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# Step 2: Compute statistical features

statistical_summary = {
'Mean': iris_df.mean(),
'Median': iris_df.median(),
'Variance': iris_df.var(),
'Standard Deviation': iris_df.std(),
'Minimum': iris_df.min(),
'Maximum': iris_df.max()
}

# Convert to DataFrame for better visualization

statistical_summary_df = pd.DataFrame(statistical_summary)
print("Statistical Features:\n", statistical_summary_df)

# Step 3: Normalize the features

# Min-Max Scaling
min_max_scaler = MinMaxScaler()
iris_df_minmax = pd.DataFrame(min_max_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Z-score Normalization
z_score_scaler = StandardScaler()
iris_df_zscore = pd.DataFrame(z_score_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Display normalized data

print("\nMin-Max Normalized Data:\n", iris_df_minmax.head())
print("\nZ-score Normalized Data:\n", iris_df_zscore.head())

# Step 4: Discussing feature relevance

# Based on the statistical properties, we can discuss the relevance of features
# For example, we can look at the variance and mean values to determine which features are more spread out and have higher v

feature_relevance = {
'Feature': iris.feature_names,
'Mean': statistical_summary_df['Mean'],
'Variance': statistical_summary_df['Variance']
}

feature_relevance_df = pd.DataFrame(feature_relevance)
print("\nFeature Relevance based on Mean and Variance:\n", feature_relevance_df)

# Discussion on feature relevance

print("\nDiscussion on Feature Relevance:")
for index, row in feature_relevance_df.iterrows():
print(f"{row['Feature']}: Mean = {row['Mean']:.2f}, Variance = {row['Variance']:.2f}")
if row['Variance'] > 0.5: # Arbitrary threshold for variance
print(f" - This feature has a relatively high variance, indicating it may be useful for classification.")
else:
print(f" - This feature has a low variance, indicating it may not be very useful for classification.")

Statistical Features:
Mean Median Variance Standard Deviation Minimum \
sepal length (cm) 5.843333 5.80 0.685694 0.828066 4.3
sepal width (cm) 3.057333 3.00 0.189979 0.435866 2.0
petal length (cm) 3.758000 4.35 3.116278 1.765298 1.0
petal width (cm) 1.199333 1.30 0.581006 0.762238 0.1

Maximum
sepal length (cm) 7.9
sepal width (cm) 4.4
petal length (cm) 6.9
petal width (cm) 2.5

Min-Max Normalized Data:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 0.222222 0.625000 0.067797 0.041667
1 0.166667 0.416667 0.067797 0.041667
2 0.111111 0.500000 0.050847 0.041667
3 0.083333 0.458333 0.084746 0.041667
4 0.194444 0.666667 0.067797 0.041667

Z-score Normalized Data:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
0 -0.900681 1.019004 -1.340227 -1.315444
1 -1.143017 -0.131979 -1.340227 -1.315444
2 -1.385353 0.328414 -1.397064 -1.315444
3 -1.506521 0.098217 -1.283389 -1.315444
4 -1.021849 1.249201 -1.340227 -1.315444

Feature Relevance based on Mean and Variance:

Feature Mean Variance
sepal length (cm) sepal length (cm) 5.843333 0.685694
sepal width (cm) sepal width (cm) 3.057333 0.189979
petal length (cm) petal length (cm) 3.758000 3.116278
petal width (cm) petal width (cm) 1.199333 0.581006

Discussion on Feature Relevance:

sepal length (cm): Mean = 5.84, Variance = 0.69
- This feature has a relatively high variance, indicating it may be useful for classification.
sepal width (cm): Mean = 3.06, Variance = 0.19
- This feature has a low variance, indicating it may not be very useful for classification.
petal length (cm): Mean = 3.76, Variance = 3.12
- This feature has a relatively high variance, indicating it may be useful for classification.
petal width (cm): Mean = 1.20, Variance = 0.58
- This feature has a relatively high variance, indicating it may be useful for classification.

# pattern recognation

# Part 2: Pattern Recognition

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['species'] = iris.target

# Step 2: Data Splitting

# Split the dataset into training and testing sets (70% training, 30% testing)
X = iris_df[iris.feature_names]
y = iris_df['species']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Normalize the features

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Step 3: Model Implementation

# K-Nearest Neighbors (KNN)
knn_params = {'n_neighbors': range(1, 21)}
knn_grid = GridSearchCV(KNeighborsClassifier(), knn_params, cv=5)
knn_grid.fit(X_train_scaled, y_train)

# Support Vector Machine (SVM)

svm_params = {'kernel': ['linear', 'rbf', 'poly'], 'C': [0.1, 1, 10]}
svm_grid = GridSearchCV(SVC(), svm_params, cv=5)
svm_grid.fit(X_train_scaled, y_train)

# Step 4: Evaluation
# Evaluate KNN
knn_best = knn_grid.best_estimator_
y_pred_knn = knn_best.predict(X_test_scaled)

# Evaluate SVM
svm_best = svm_grid.best_estimator_
y_pred_svm = svm_best.predict(X_test_scaled)

# Calculate metrics
metrics = {
'Model': ['KNN', 'SVM'],
'Accuracy': [accuracy_score(y_test, y_pred_knn), accuracy_score(y_test, y_pred_svm)],
'Precision': [precision_score(y_test, y_pred_knn, average='weighted'), precision_score(y_test, y_pred_svm, average='weigh
'Recall': [recall_score(y_test, y_pred_knn, average='weighted'), recall_score(y_test, y_pred_svm, average='weighted')],
'F1 Score': [f1_score(y_test, y_pred_knn, average='weighted'), f1_score(y_test, y_pred_svm, average='weighted')]
}

metrics_df = pd.DataFrame(metrics)
print("\nEvaluation Metrics:\n", metrics_df)

# Step 5: Plot confusion matrices

def plot_confusion_matrix(y_true, y_pred, model_name):
cm = confusion_matrix(y_true, y_pred)
plt.figure(figsize=(6, 4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=iris.target_names, yticklabels=iris.target_names)
plt.title(f'Confusion Matrix for {model_name}')
plt.xlabel('Predicted')
plt.ylabel('True')
plt.show()

plot_confusion_matrix(y_test, y_pred_knn, 'KNN')

plot_confusion_matrix(y_test, y_pred_svm, 'SVM')
Evaluation Metrics:
Model Accuracy Precision Recall F1 Score
0 KNN 1.000000 1.000000 1.000000 1.000000
1 SVM 0.977778 0.979365 0.977778 0.977745

# 4. Comparison and Conclusion

# Part 3: Model Comparison and Conclusion

# Step 1: Import necessary libraries

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['species'] = iris.target

# Step 2: Data Splitting

# Normalize the features

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Step 3: Model Implementation

# K-Nearest Neighbors (KNN)
knn_params = {'n_neighbors': range(1, 21)}
knn_grid = GridSearchCV(KNeighborsClassifier(), knn_params, cv=5)
knn_grid.fit(X_train_scaled, y_train)

# Support Vector Machine (SVM)

svm_params = {'kernel': ['linear', 'rbf', 'poly'], 'C': [0.1, 1, 10]}
svm_grid = GridSearchCV(SVC(), svm_params, cv=5)
svm_grid.fit(X_train_scaled, y_train)

# Step 4: Evaluation
# Evaluate KNN
knn_best = knn_grid.best_estimator_
y_pred_knn = knn_best.predict(X_test_scaled)

# Evaluate SVM
svm_best = svm_grid.best_estimator_
y_pred_svm = svm_best.predict(X_test_scaled)

# Calculate metrics
metrics = {
'Model': ['KNN', 'SVM'],
'Accuracy': [accuracy_score(y_test, y_pred_knn), accuracy_score(y_test, y_pred_svm)],
'Precision': [precision_score(y_test, y_pred_knn, average='weighted'), precision_score(y_test, y_pred_svm, average='weig
'Recall': [recall_score(y_test, y_pred_knn, average='weighted'), recall_score(y_test, y_pred_svm, average='weighted')],
'F1 Score': [f1_score(y_test, y_pred_knn, average='weighted'), f1_score(y_test, y_pred_svm, average='weighted')]
}

metrics_df = pd.DataFrame(metrics)
print("\nEvaluation Metrics:\n", metrics_df)

# Step 5: Plotting the comparison

metrics_df.set_index('Model').plot(kind='bar', figsize=(10, 6))
plt.title('Model Comparison')
plt.ylabel('Score')
plt.xticks(rotation=0)
plt.ylim(0, 1)
plt.grid(axis='y')
plt.show()

# Step 6: Discussion
best_model = metrics_df.loc[metrics_df['Accuracy'].idxmax()]
print("\nBest Model:")
print(f"Model: {best_model['Model']}")
print(f"Accuracy: {best_model['Accuracy']:.2f}")
print(f"Precision: {best_model['Precision']:.2f}")
print(f"Recall: {best_model['Recall']:.2f}")
print(f"F1 Score: {best_model['F1 Score']:.2f}")
Evaluation Metrics:
Model Accuracy Precision Recall F1 Score
0 KNN 1.000000 1.000000 1.000000 1.000000
1 SVM 0.977778 0.979365 0.977778 0.977745

Best Model:
Model: KNN
Accuracy: 1.00
Precision: 1.00
Recall: 1.00
F1 Score: 1.00

# delivarables:

# Part 1: Feature Extraction and Statistical Analysis

# Step 1: Import necessary libraries

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Load the Iris dataset

iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# Step 2: Compute statistical features

statistical_summary = {
'Mean': iris_df.mean(),
'Median': iris_df.median(),
'Variance': iris_df.var(),
'Standard Deviation': iris_df.std(),
'Minimum': iris_df.min(),
'Maximum': iris_df.max()
}

# Convert to DataFrame for better visualization

statistical_summary_df = pd.DataFrame(statistical_summary)
#print("Statistical Features:\n", statistical_summary_df)

# Step 3: Normalize the features

# Min-Max Scaling
min_max_scaler = MinMaxScaler()
iris_df_minmax = pd.DataFrame(min_max_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Z-score Normalization
z_score_scaler = StandardScaler()
iris_df_zscore = pd.DataFrame(z_score_scaler.fit_transform(iris_df), columns=iris.feature_names)

# Display normalized data

#print("\nMin-Max Normalized Data:\n", iris_df_minmax.head())

Experiment 11 PML
No ratings yet
Experiment 11 PML
3 pages
DSBDA3
No ratings yet
DSBDA3
3 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
Practical 10 Code
No ratings yet
Practical 10 Code
5 pages
Assignment 3 Iris
No ratings yet
Assignment 3 Iris
2 pages
Summary (Iris) #View Statistical Summary of Dataset
No ratings yet
Summary (Iris) #View Statistical Summary of Dataset
1 page
K Means On IRIS Dataset
No ratings yet
K Means On IRIS Dataset
4 pages
Experiment 3
No ratings yet
Experiment 3
4 pages
DML About Put
No ratings yet
DML About Put
2 pages
Experiment 3
No ratings yet
Experiment 3
2 pages
25 - Assignment10.ipynb - Colaboratory
No ratings yet
25 - Assignment10.ipynb - Colaboratory
13 pages
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
No ratings yet
Anuj Khandelwal 3029 BCP A Business Analytics Continuous Assessment 2
20 pages
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
No ratings yet
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
7 pages
Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
Assignment 5'
No ratings yet
Assignment 5'
4 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
Assignment1ML Prem - Ipynb - Colab
No ratings yet
Assignment1ML Prem - Ipynb - Colab
4 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
Data Visualization
No ratings yet
Data Visualization
18 pages
Name:-Nisha Ambike: Roll No: - 02
No ratings yet
Name:-Nisha Ambike: Roll No: - 02
2 pages
Code
No ratings yet
Code
3 pages
Import As Import As From Import Import As Import As From Import From Import From Import
No ratings yet
Import As Import As From Import Import As Import As From Import From Import From Import
6 pages
Dsfasdflalksdflkasdjfasf
No ratings yet
Dsfasdflalksdflkasdjfasf
4 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
Data Visualizationyuo
No ratings yet
Data Visualizationyuo
28 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
No ratings yet
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
5 pages
Normalization
No ratings yet
Normalization
4 pages
RP 3
No ratings yet
RP 3
32 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
Vansh 3089 CA2
No ratings yet
Vansh 3089 CA2
13 pages
Import As Import As Import As From Import Import As Import
No ratings yet
Import As Import As Import As From Import Import As Import
7 pages
Base de Datos IRIS Codigos R Utilizados para El Analisis
No ratings yet
Base de Datos IRIS Codigos R Utilizados para El Analisis
4 pages
137 Vsec 6
No ratings yet
137 Vsec 6
2 pages
10 (3146)
No ratings yet
10 (3146)
2 pages
AbhishekVallecha 2003184 ADS Exp9
No ratings yet
AbhishekVallecha 2003184 ADS Exp9
6 pages
Iris Data Clustering Analysis
No ratings yet
Iris Data Clustering Analysis
6 pages
SVM and KNN
No ratings yet
SVM and KNN
3 pages
Assign10.Ipynb - Colab
No ratings yet
Assign10.Ipynb - Colab
8 pages
6 Lab
No ratings yet
6 Lab
16 pages
085
No ratings yet
085
4 pages
Nandini Matplotlib Ws
No ratings yet
Nandini Matplotlib Ws
10 pages
Annals of Eugenics - September 1936 - Fisher - The Use of Multiple Measurements in Taxonomic Problems
No ratings yet
Annals of Eugenics - September 1936 - Fisher - The Use of Multiple Measurements in Taxonomic Problems
11 pages
Ex No4
No ratings yet
Ex No4
3 pages
Program1 MLA Lab 2025 250109 144615
No ratings yet
Program1 MLA Lab 2025 250109 144615
17 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
ML Lab Record
No ratings yet
ML Lab Record
64 pages
Tarea - 1.ipynb - Colab Jose
No ratings yet
Tarea - 1.ipynb - Colab Jose
12 pages
Dsbda 3B
No ratings yet
Dsbda 3B
5 pages
Experiment 1
No ratings yet
Experiment 1
2 pages
Ploomber Notebook Conversion - 2
No ratings yet
Ploomber Notebook Conversion - 2
14 pages
10 TH
No ratings yet
10 TH
7 pages
Iris Dataset Analysis & Visualization
No ratings yet
Iris Dataset Analysis & Visualization
4 pages
Data Analytics Assignment
No ratings yet
Data Analytics Assignment
8 pages
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
No ratings yet
Matplotlib Styles: 1. Test - Generate - Plot - With - Style1
2 pages
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
No ratings yet
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
21 pages
Radix Sort
No ratings yet
Radix Sort
5 pages
Quick Sort
No ratings yet
Quick Sort
4 pages
Insertion Sort
No ratings yet
Insertion Sort
3 pages
Bubble Sort
No ratings yet
Bubble Sort
3 pages
Selection Sort
No ratings yet
Selection Sort
3 pages
Merge Sort
No ratings yet
Merge Sort
5 pages
Assignment 8
No ratings yet
Assignment 8
7 pages
Heap Sort
No ratings yet
Heap Sort
4 pages
Software Engineering Lab
No ratings yet
Software Engineering Lab
5 pages
Assignment 09
No ratings yet
Assignment 09
23 pages
Ass - 11.ipynb - Colab
No ratings yet
Ass - 11.ipynb - Colab
7 pages
All Important Formula For BSC 301
No ratings yet
All Important Formula For BSC 301
21 pages
Probability & Statistics Homework
No ratings yet
Probability & Statistics Homework
11 pages
Question Bank Thermal Engineering UPDATED
No ratings yet
Question Bank Thermal Engineering UPDATED
6 pages
Basic Statistics Solutions Guide
No ratings yet
Basic Statistics Solutions Guide
3 pages
Junior Mathematics Olympiads
No ratings yet
Junior Mathematics Olympiads
5 pages
QR Paper
No ratings yet
QR Paper
69 pages
Chain Rule
100% (1)
Chain Rule
3 pages
Health Statistics Study Guide
No ratings yet
Health Statistics Study Guide
13 pages
Observer-Based Reduced Order Controller Design For The Stabilization of Large Scale Linear Discrete-Time Control Systems
No ratings yet
Observer-Based Reduced Order Controller Design For The Stabilization of Large Scale Linear Discrete-Time Control Systems
11 pages
Circular Shift and Convolution Guide
No ratings yet
Circular Shift and Convolution Guide
4 pages
Quality Control and Inspection
No ratings yet
Quality Control and Inspection
67 pages
Integrity Assessment of Bucket Wheel Excavator Welded Structures by Using The Single Selection Method
No ratings yet
Integrity Assessment of Bucket Wheel Excavator Welded Structures by Using The Single Selection Method
6 pages
AP Physics B Dynamic Practice Workbook
No ratings yet
AP Physics B Dynamic Practice Workbook
52 pages
TC Syllabus
No ratings yet
TC Syllabus
3 pages
Determination of Coefficient of Linear Expansion of A Metal Rod
50% (2)
Determination of Coefficient of Linear Expansion of A Metal Rod
5 pages
Digital Content Processing (DCP)
No ratings yet
Digital Content Processing (DCP)
47 pages
VTU Civil 5 Sem Surveying Practice Manual - 18CVL57
No ratings yet
VTU Civil 5 Sem Surveying Practice Manual - 18CVL57
67 pages
Limit Equilibrium Analysis or Passive Earth Pressure Equation
No ratings yet
Limit Equilibrium Analysis or Passive Earth Pressure Equation
23 pages
Synchronizing A Triple Dragline Stripping System in Thick Overburden
No ratings yet
Synchronizing A Triple Dragline Stripping System in Thick Overburden
14 pages
MSC Research Project Dissertation Guideline 2019-20
No ratings yet
MSC Research Project Dissertation Guideline 2019-20
14 pages
ch07 fn202
No ratings yet
ch07 fn202
61 pages
Cee101 Sim
No ratings yet
Cee101 Sim
142 pages
C A D - BPD Manual 23.07.2018
No ratings yet
C A D - BPD Manual 23.07.2018
68 pages
Module 1 Quiz
No ratings yet
Module 1 Quiz
2 pages
Reasoning 3 Mock Test in One Class
No ratings yet
Reasoning 3 Mock Test in One Class
88 pages
10-Parametric Equations and Polar Coordinates
No ratings yet
10-Parametric Equations and Polar Coordinates
11 pages
Technical Drawing 8 (Q1-Week 1)
No ratings yet
Technical Drawing 8 (Q1-Week 1)
4 pages
(Ebook) A Practical Approach To Motor Vehicle Engineering and Maint. by A. Bonnick, D. Newbold ISBN 9781865843834, 9780750663144, 1865843830, 0750663146 Download
100% (1)
(Ebook) A Practical Approach To Motor Vehicle Engineering and Maint. by A. Bonnick, D. Newbold ISBN 9781865843834, 9780750663144, 1865843830, 0750663146 Download
111 pages
Engineering Course Overview
No ratings yet
Engineering Course Overview
7 pages
Java Collections: - Basim Ahmad
No ratings yet
Java Collections: - Basim Ahmad
10 pages

Ass - 10.ipynb - Colab

Uploaded by

Ass - 10.ipynb - Colab

Uploaded by

Start coding or generate with AI.

Double-click (or enter) to edit

# Import necessary libraries

# Load the Iris dataset from sklearn

# Display the first 5 rows of the dataset

# Identify features and labels

# Plot the distribution of each feature using histograms

# Visualize the dataset using a scatterplot matrix

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Compute statistical features

# Convert to DataFrame for better visualization

# Step 3: Normalize the features

# Display normalized data

# Step 4: Discussing feature relevance

# Discussion on feature relevance

Min-Max Normalized Data:

Z-score Normalized Data:

Feature Relevance based on Mean and Variance:

Discussion on Feature Relevance:

# Part 2: Pattern Recognition

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Data Splitting

# Normalize the features

# Step 3: Model Implementation

# Support Vector Machine (SVM)

# Step 5: Plot confusion matrices

plot_confusion_matrix(y_test, y_pred_knn, 'KNN')

# 4. Comparison and Conclusion

# Part 3: Model Comparison and Conclusion

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Data Splitting

# Normalize the features

# Step 3: Model Implementation

# Support Vector Machine (SVM)

# Step 5: Plotting the comparison

# Part 1: Feature Extraction and Statistical Analysis

# Step 1: Import necessary libraries

# Load the Iris dataset

# Step 2: Compute statistical features

# Convert to DataFrame for better visualization

# Step 3: Normalize the features

# Display normalized data

You might also like