0% found this document useful (0 votes)

19 views7 pages

Data Mining Lab Manual

Mtech data mining lab manual

Uploaded by

jyothibg

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views7 pages

Data Mining Lab Manual

Mtech data mining lab manual

Uploaded by

jyothibg

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

import numpy as np

arr1=np.array([[1,2,3],[4,5,6],[7,8,9],[23,33,45]])
print(f'Original Array:\n{arr1}')
arr1_transpose = arr1.transpose()
print(f'Transposed Array:\n{arr1_transpose}')
arr2=np.array([[10,20,30],[45,78,90],[1,2,3],[34,67,89]])
print(f'Original Array:\n{arr2}')
arr2_transpose=arr2.transpose()
print(f'Transposed Array:\n{arr2_transpose}')
Original Array:
[[ 1 2 3]
[ 4 5 6]
[ 7 8 9]
[23 33 45]]
Transposed Array:
[[ 1 4 7 23]
[ 2 5 8 33]
[ 3 6 9 45]]
Original Array:
[[10 20 30]
[45 78 90]
[ 1 2 3]
[34 67 89]]
Transposed Array:
[[10 45 1 34]
[20 78 2 67]
[30 90 3 89]]
In [11]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

# Generate synthetic data

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60,
random_state=0)

# Plot the data points

plt.scatter(X[:, 0], X[:, 1], s=50)
plt.title('Original Data Points')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

# Apply K-means clustering

kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
y_kmeans = kmeans.predict(X)

# Plot the clustered data points and centroids

plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75)
plt.title('Clustered Data with Centroids')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

In [12]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# Generate synthetic data

np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 3 + 4 * X + np.random.randn(100, 1)
# Plot the data points
plt.scatter(X, y, color='blue')
plt.title('Linear Regression Example')
plt.xlabel('X')
plt.ylabel('y')
plt.show()

# Fit the linear regression model

model = LinearRegression()
model.fit(X, y)

# Predictions
X_new = np.array([[0], [2]])
y_pred = model.predict(X_new)

# Plot the linear regression line

plt.scatter(X, y, color='blue')
plt.plot(X_new, y_pred, color='red', linewidth=3)
plt.title('Linear Regression Fit')
plt.xlabel('X')
plt.ylabel('y')
plt.show()

# Coefficients and intercept

print('Coefficients:', model.coef_)
print('Intercept:', model.intercept_)
Coefficients: [[3.96846751]]
Intercept: [3.22215108]
In [ ]:
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
data = {
'Transaction_ID': [1, 1, 1, 2, 2, 3, 3, 3, 4, 4],
'Item': ['A', 'B', 'C', 'A', 'B', 'B', 'C', 'D', 'A', 'C']
}
df = pd.DataFrame(data)
basket = (df.groupby(['Transaction_ID', 'Item'])['Item']
.count().unstack().reset_index().fillna(0)
.set_index('Transaction_ID'))
def encode_units(x):
if x <= 0:
return 0
if x >= 1:
return 1

basket_sets = basket.applymap(encode_units)

frequent_itemsets = apriori(basket_sets, min_support=0.2, use_colnames=True)

# Generate association rules

rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1.2)

# Print the frequent itemsets

print("Frequent Itemsets:")
print(frequent_itemsets)
# Print the association rules
print("\nAssociation Rules:")
print(rules)
out put:
Frequent Itemsets:
support itemsets
0 0.75 (A)
1 0.75 (B)
2 0.75 (C)
3 0.25 (D)
4 0.50 (A, B)
5 0.50 (A, C)
6 0.50 (C, B)
7 0.25 (D, B)
8 0.25 (D, C)
9 0.25 (A, B, C)
10 0.25 (D, C, B)

Association Rules:
antecedents consequents antecedent support consequent support supp
ort \
0 (D) (B) 0.25 0.75 0
.25
1 (B) (D) 0.75 0.25 0
.25
2 (D) (C) 0.25 0.75 0
.25
3 (C) (D) 0.75 0.25 0
.25
4 (D, C) (B) 0.25 0.75 0
.25
5 (D, B) (C) 0.25 0.75 0
.25
6 (C, B) (D) 0.50 0.25 0
.25
7 (D) (C, B) 0.25 0.50 0
.25
8 (C) (D, B) 0.75 0.25 0
.25
9 (B) (D, C) 0.75 0.25 0
.25

confidence lift leverage conviction zhangs_metric

0 1.000000 1.333333 0.0625 inf 0.333333
1 0.333333 1.333333 0.0625 1.125 1.000000
2 1.000000 1.333333 0.0625 inf 0.333333
3 0.333333 1.333333 0.0625 1.125 1.000000
4 1.000000 1.333333 0.0625 inf 0.333333
5 1.000000 1.333333 0.0625 inf 0.333333
6 0.500000 2.000000 0.1250 1.500 1.000000
7 1.000000 2.000000 0.1250 inf 0.666667
8 0.333333 1.333333 0.0625 1.125 1.000000
9 0.333333 1.333333 0.0625 1.125 1.000000

# Import necessary libraries

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.preprocessing import StandardScaler

# Load the heart disease dataset (assuming it's in CSV format)

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/heart-
disease/processed.cleveland.data"
names = ['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg',
'thalach', 'exang', 'oldpeak', 'slope', 'ca', 'thal', 'target']
data = pd.read_csv(url, names=names, na_values='?')

# Drop rows with missing values

data = data.dropna()

# Separate features and target variable

X = data.drop('target', axis=1)
y = data['target']

# Convert categorical variables to dummy variables if needed

# (Not necessary here as the dataset is already preprocessed)

# Split the data into training and testing sets (80% train, 20% test)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardize features by removing the mean and scaling to unit variance

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Build the decision tree classifier

clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)

# Predict on the test data

y_pred = clf.predict(X_test)

# Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}\n")

print("Classification Report:")
print(classification_report(y_test, y_pred))

output:
Accuracy: 0.48

Classification Report:
precision recall f1-score support
0 0.89 0.67 0.76 36
1 0.13 0.22 0.17 9
2 0.12 0.20 0.15 5
3 0.25 0.29 0.27 7
4 0.00 0.00 0.00 3

accuracy 0.48 60
macro avg 0.28 0.27 0.27 60
weighted avg 0.59 0.48 0.53 60

ML Program 7, 8,9 And10
No ratings yet
ML Program 7, 8,9 And10
12 pages
MNIST Digit Recognition Guide
No ratings yet
MNIST Digit Recognition Guide
8 pages
EXP - 7 - Prasham Doshi - 22bec097
No ratings yet
EXP - 7 - Prasham Doshi - 22bec097
7 pages
ML RECORD EX 5,6,7,8,9 (Without Border)
No ratings yet
ML RECORD EX 5,6,7,8,9 (Without Border)
13 pages
KNN Classifier on Digits Data
No ratings yet
KNN Classifier on Digits Data
3 pages
7 Output
No ratings yet
7 Output
4 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
K Fold
No ratings yet
K Fold
6 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
Week 4 Naive Bayes Classifier
No ratings yet
Week 4 Naive Bayes Classifier
2 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
ML Labs
No ratings yet
ML Labs
14 pages
ML Lab Prgms Split
No ratings yet
ML Lab Prgms Split
3 pages
Machine Learning - Lab Record
No ratings yet
Machine Learning - Lab Record
43 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
D3 Docs
No ratings yet
D3 Docs
6 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
ML Record Print
No ratings yet
ML Record Print
20 pages
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
No ratings yet
G 203008076 - 4 - Christhian Quiñonez - Ex1 - 2 A PDF
20 pages
Apriori
No ratings yet
Apriori
8 pages
Localweighted - Jupyter Notebook
No ratings yet
Localweighted - Jupyter Notebook
4 pages
Indi - Colab
No ratings yet
Indi - Colab
11 pages
ML Lab
No ratings yet
ML Lab
29 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Aiml Lab
No ratings yet
Aiml Lab
37 pages
ML FINAL Lab Manual
No ratings yet
ML FINAL Lab Manual
7 pages
Project 1
No ratings yet
Project 1
6 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
DL Lab 3
No ratings yet
DL Lab 3
5 pages
Shubham Pract 6 - Merged
No ratings yet
Shubham Pract 6 - Merged
12 pages
Code
No ratings yet
Code
5 pages
Aiml Lab
No ratings yet
Aiml Lab
14 pages
TI2134 PracticalAssignment 2
No ratings yet
TI2134 PracticalAssignment 2
4 pages
Logistic Regression Using Python
No ratings yet
Logistic Regression Using Python
9 pages
Stat Lab
No ratings yet
Stat Lab
24 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
DataAnalytics Lab Manual
No ratings yet
DataAnalytics Lab Manual
35 pages
Tanu Raman ML Lab File
No ratings yet
Tanu Raman ML Lab File
21 pages
DA Programs
No ratings yet
DA Programs
44 pages
11zon - Merged-Files (1) - Removed - Removed
No ratings yet
11zon - Merged-Files (1) - Removed - Removed
7 pages
Wa0003
No ratings yet
Wa0003
16 pages
Data Mining Solve
No ratings yet
Data Mining Solve
5 pages
ADADELTA
No ratings yet
ADADELTA
2 pages
DSBDA6
No ratings yet
DSBDA6
6 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
7 pages
Project 3 - Diabetes Prediction - Ipynb - Colab
No ratings yet
Project 3 - Diabetes Prediction - Ipynb - Colab
4 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
EE 559 HW2Code PDF
No ratings yet
EE 559 HW2Code PDF
7 pages
IRIS Dataset Regression Models
No ratings yet
IRIS Dataset Regression Models
3 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
ML Record
No ratings yet
ML Record
14 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
13 pages
Project 4 - House Price Prediction - Ipynb - Colab
No ratings yet
Project 4 - House Price Prediction - Ipynb - Colab
5 pages
4.4. Data Standardization - Ipynb - Colaboratory
No ratings yet
4.4. Data Standardization - Ipynb - Colaboratory
1 page
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
ML Journal
No ratings yet
ML Journal
58 pages
Rajeek8 12
No ratings yet
Rajeek8 12
21 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Week 1 To Week 12 Quize Questions
No ratings yet
Week 1 To Week 12 Quize Questions
24 pages
Iot Mtech Notes
No ratings yet
Iot Mtech Notes
57 pages
IT Skills Lesson Plan 1st SM
No ratings yet
IT Skills Lesson Plan 1st SM
8 pages
Operating Systems Overview
No ratings yet
Operating Systems Overview
46 pages
Shell Programming
No ratings yet
Shell Programming
17 pages
Online Mobile Recharge
No ratings yet
Online Mobile Recharge
29 pages
A Data Mining Based Model For Identifying of Spurious Behaviour in Water Utilization
No ratings yet
A Data Mining Based Model For Identifying of Spurious Behaviour in Water Utilization
5 pages
Army University and The Army Learning Strategy: Dr. Keith R. Beurskens
No ratings yet
Army University and The Army Learning Strategy: Dr. Keith R. Beurskens
21 pages
Water Fraud REPORT
0% (2)
Water Fraud REPORT
63 pages
Lab Report Using WEKA Lab Report Using WEKA
No ratings yet
Lab Report Using WEKA Lab Report Using WEKA
21 pages
Factors Influencing Tourists' Nightlife Experience in Belgrade
No ratings yet
Factors Influencing Tourists' Nightlife Experience in Belgrade
17 pages
Weka Data Analysis Guide
No ratings yet
Weka Data Analysis Guide
21 pages
Data Mining Question Bank
No ratings yet
Data Mining Question Bank
4 pages
Frequent Pattern Mining
No ratings yet
Frequent Pattern Mining
2 pages
Apriori Algorithm: 1 Setting
No ratings yet
Apriori Algorithm: 1 Setting
3 pages
Retail Market Basket Analysis
No ratings yet
Retail Market Basket Analysis
43 pages
Chap7 Extended Association Analysis
No ratings yet
Chap7 Extended Association Analysis
67 pages
Cs701 Data Warehouse and Data Mining
No ratings yet
Cs701 Data Warehouse and Data Mining
23 pages
Data Mining Session 6 - Main Theme Mining Frequent Patterns, Association, and Correlations Dr. Jean-Claude Franchitti
No ratings yet
Data Mining Session 6 - Main Theme Mining Frequent Patterns, Association, and Correlations Dr. Jean-Claude Franchitti
66 pages
A Review of Machine Learning Applications in Human Resource Management
No ratings yet
A Review of Machine Learning Applications in Human Resource Management
21 pages
The Eclat Algorithm Final
No ratings yet
The Eclat Algorithm Final
12 pages
Dmdw-Unit-1 R16
No ratings yet
Dmdw-Unit-1 R16
17 pages
Data Mining Written Notes 1
No ratings yet
Data Mining Written Notes 1
35 pages
Data Mining Practice Final Exam Solutions: True/False Questions
100% (1)
Data Mining Practice Final Exam Solutions: True/False Questions
5 pages
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
No ratings yet
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
2 pages
Data Mining - Mining Sequential Patterns
No ratings yet
Data Mining - Mining Sequential Patterns
10 pages
Web Mining - Lec1 2
No ratings yet
Web Mining - Lec1 2
62 pages
Data Analytics Unit III
No ratings yet
Data Analytics Unit III
88 pages
Data Mining Cheat Sheet
No ratings yet
Data Mining Cheat Sheet
6 pages
Big Data's Role in Financial Audits
No ratings yet
Big Data's Role in Financial Audits
24 pages
Exam DUT 070816 Ans
No ratings yet
Exam DUT 070816 Ans
5 pages
ML Systems & Data Science Guide
No ratings yet
ML Systems & Data Science Guide
26 pages
Chap5 Frequent Itemset
No ratings yet
Chap5 Frequent Itemset
70 pages
Clustering Techniques Comparison
No ratings yet
Clustering Techniques Comparison
18 pages
Association Rule in Data Mining
No ratings yet
Association Rule in Data Mining
4 pages
Efficient Algorithm for Closed Itemsets
No ratings yet
Efficient Algorithm for Closed Itemsets
8 pages
Kunal DS
No ratings yet
Kunal DS
92 pages
4-4 Autonomous Syllabus R-15 250418
No ratings yet
4-4 Autonomous Syllabus R-15 250418
44 pages
QM 20242 Cs5228 Lecture01 Introduction
No ratings yet
QM 20242 Cs5228 Lecture01 Introduction
80 pages

Data Mining Lab Manual

Uploaded by

Data Mining Lab Manual

Uploaded by

import numpy as np

# Generate synthetic data

# Plot the data points

# Apply K-means clustering

# Plot the clustered data points and centroids

# Generate synthetic data

# Fit the linear regression model

# Plot the linear regression line

# Coefficients and intercept

frequent_itemsets = apriori(basket_sets, min_support=0.2, use_colnames=True)

# Generate association rules

# Print the frequent itemsets

confidence lift leverage conviction zhangs_metric

# Import necessary libraries

# Load the heart disease dataset (assuming it's in CSV format)

# Drop rows with missing values

# Separate features and target variable

# Convert categorical variables to dummy variables if needed

# Standardize features by removing the mean and scaling to unit variance

# Build the decision tree classifier

# Predict on the test data

# Evaluate the model

You might also like