0% found this document useful (0 votes)

33 views17 pages

Experiment 8 Heirarchical Clustering

The document discusses analyzing customer data using hierarchical clustering in Python. Various clustering techniques are applied including single, complete, average and ward linkage methods. Cophenetic correlation is calculated to evaluate the cluster formations.

Uploaded by

Yuvraj Singh Rathore

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

33 views17 pages

Experiment 8 Heirarchical Clustering

Uploaded by

Yuvraj Singh Rathore

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 17

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt

data=pd.read_csv("Mall_Customers.csv")
data.head()

CustomerID Genre Age Annual Income (k$) Spending Score (1-100)

0 1 Male 19 15 39
1 2 Male 21 15 81
2 3 Female 20 16 6
3 4 Female 23 16 77
4 5 Female 31 17 40

data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 200 entries, 0 to 199
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 CustomerID 200 non-null int64
1 Genre 200 non-null object
2 Age 200 non-null int64
3 Annual Income (k$) 200 non-null int64
4 Spending Score (1-100) 200 non-null int64
dtypes: int64(4), object(1)
memory usage: 7.9+ KB

data.isnull().sum()

CustomerID 0
Genre 0
Age 0
Annual Income (k$) 0
Spending Score (1-100) 0
dtype: int64

#Count total number of classes in Data

class_counts = data.groupby('Genre').size()
print(class_counts)

Genre
Female 112
Male 88
dtype: int64

types = data.dtypes
print(types)
CustomerID int64
Genre object
Age int64
Annual Income (k$) int64
Spending Score (1-100) int64
dtype: object

data.hist()
plt.show()

# Extracting features of dataset

X = data.iloc[:,[3,4]].values

array([[ 15, 39],

[ 15, 81],
[ 16, 6],
[ 16, 77],
[ 17, 40],
[ 17, 76],
[ 18, 6],
[ 18, 94],
[ 19, 3],
[ 19, 72],
[ 19, 14],
[ 19, 99],
[ 20, 15],
[ 20, 77],
[ 20, 13],
[ 20, 79],
[ 21, 35],
[ 21, 66],
[ 23, 29],
[ 23, 98],
[ 24, 35],
[ 24, 73],
[ 25, 5],
[ 25, 73],
[ 28, 14],
[ 28, 82],
[ 28, 32],
[ 28, 61],
[ 29, 31],
[ 29, 87],
[ 30, 4],
[ 30, 73],
[ 33, 4],
[ 33, 92],
[ 33, 14],
[ 33, 81],
[ 34, 17],
[ 34, 73],
[ 37, 26],
[ 37, 75],
[ 38, 35],
[ 38, 92],
[ 39, 36],
[ 39, 61],
[ 39, 28],
[ 39, 65],
[ 40, 55],
[ 40, 47],
[ 40, 42],
[ 40, 42],
[ 42, 52],
[ 42, 60],
[ 43, 54],
[ 43, 60],
[ 43, 45],
[ 43, 41],
[ 44, 50],
[ 44, 46],
[ 46, 51],
[ 46, 46],
[ 46, 56],
[ 46, 55],
[ 47, 52],
[ 47, 59],
[ 48, 51],
[ 48, 59],
[ 48, 50],
[ 48, 48],
[ 48, 59],
[ 48, 47],
[ 49, 55],
[ 49, 42],
[ 50, 49],
[ 50, 56],
[ 54, 47],
[ 54, 54],
[ 54, 53],
[ 54, 48],
[ 54, 52],
[ 54, 42],
[ 54, 51],
[ 54, 55],
[ 54, 41],
[ 54, 44],
[ 54, 57],
[ 54, 46],
[ 57, 58],
[ 57, 55],
[ 58, 60],
[ 58, 46],
[ 59, 55],
[ 59, 41],
[ 60, 49],
[ 60, 40],
[ 60, 42],
[ 60, 52],
[ 60, 47],
[ 60, 50],
[ 61, 42],
[ 61, 49],
[ 62, 41],
[ 62, 48],
[ 62, 59],
[ 62, 55],
[ 62, 56],
[ 62, 42],
[ 63, 50],
[ 63, 46],
[ 63, 43],
[ 63, 48],
[ 63, 52],
[ 63, 54],
[ 64, 42],
[ 64, 46],
[ 65, 48],
[ 65, 50],
[ 65, 43],
[ 65, 59],
[ 67, 43],
[ 67, 57],
[ 67, 56],
[ 67, 40],
[ 69, 58],
[ 69, 91],
[ 70, 29],
[ 70, 77],
[ 71, 35],
[ 71, 95],
[ 71, 11],
[ 71, 75],
[ 71, 9],
[ 71, 75],
[ 72, 34],
[ 72, 71],
[ 73, 5],
[ 73, 88],
[ 73, 7],
[ 73, 73],
[ 74, 10],
[ 74, 72],
[ 75, 5],
[ 75, 93],
[ 76, 40],
[ 76, 87],
[ 77, 12],
[ 77, 97],
[ 77, 36],
[ 77, 74],
[ 78, 22],
[ 78, 90],
[ 78, 17],
[ 78, 88],
[ 78, 20],
[ 78, 76],
[ 78, 16],
[ 78, 89],
[ 78, 1],
[ 78, 78],
[ 78, 1],
[ 78, 73],
[ 79, 35],
[ 79, 83],
[ 81, 5],
[ 81, 93],
[ 85, 26],
[ 85, 75],
[ 86, 20],
[ 86, 95],
[ 87, 27],
[ 87, 63],
[ 87, 13],
[ 87, 75],
[ 87, 10],
[ 87, 92],
[ 88, 13],
[ 88, 86],
[ 88, 15],
[ 88, 69],
[ 93, 14],
[ 93, 90],
[ 97, 32],
[ 97, 86],
[ 98, 15],
[ 98, 88],
[ 99, 39],
[ 99, 97],
[101, 24],
[101, 68],
[103, 17],
[103, 85],
[103, 23],
[103, 69],
[113, 8],
[113, 91],
[120, 16],
[120, 79],
[126, 28],
[126, 74],
[137, 18],
[137, 83]], dtype=int64)

# Using the dendrogram to find the optimal number of clusters

#single linkage --> min distance between two dataset points
import scipy.cluster.hierarchy as sch
dendrogram = sch.dendrogram(sch.linkage(X, method = 'single'))
plt.title('Dendrogram')
plt.xlabel('Customers')
plt.ylabel('Euclidean distances')
plt.show()

# Using the dendrogram to find the optimal number of clusters

#complete linkage --> max distance between two dataset points
import scipy.cluster.hierarchy as sch
dendrogram = sch.dendrogram(sch.linkage(X, method = 'complete'))
plt.title('Dendrogram')
plt.xlabel('Customers')
plt.ylabel('Euclidean distances')
plt.show()
# Using the dendrogram to find the optimal number of clusters
import scipy.cluster.hierarchy as sch
dendrogram = sch.dendrogram(sch.linkage(X, method = 'average'))
plt.title('Dendrogram')
plt.xlabel('Customers')
plt.ylabel('Euclidean distances')
plt.show()
# Using the dendrogram to find the optimal number of clusters
import scipy.cluster.hierarchy as sch
dendrogram = sch.dendrogram(sch.linkage(X, method = 'ward'))
plt.title('Dendrogram')
plt.xlabel('Customers')
plt.ylabel('Euclidean distances')
plt.show()
import scipy.cluster.hierarchy as sch
plt.figure(figsize=(10, 7))
plt.title("Dendrograms")
dend = sch.dendrogram(sch.linkage(X, method='ward'))
plt.axhline(y=200, color='r', linestyle='--')
<matplotlib.lines.Line2D at 0x2cb3a4b2e00>
from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage
import numpy as np
Z = linkage(X, 'ward')

# cophetic distance between two observation that have been cluster is

defined to be inter group dissimilarity at which the two observation
are first combined into a single cluster

from scipy.cluster.hierarchy import cophenet

from scipy.spatial.distance import pdist

c, coph_dists = cophenet(Z, pdist(X))

print('The cophentic correlation distance for ward method ', c)
print(' The cophenetic distance matrix in condensed form for ward
method ', coph_dists)

The cophentic correlation distance for ward method 0.7179298392392908

The cophenetic distance matrix in condensed form for ward method
[262.5626341 81.17935867 262.5626341 ... 394.8596576 17.82320585
394.8596576 ]
A = linkage(X, 'average')
from scipy.cluster.hierarchy import cophenet
from scipy.spatial.distance import pdist

c, coph_dists = cophenet(A, pdist(X))

print('The cophentic correlation distance for average method ', c)
print(' The cophenetic distance matrix in condensed form for average
method ', coph_dists)

The cophentic correlation distance for average method

0.7213231987699918
The cophenetic distance matrix in condensed form for average method
[47.09220913 26.24608062 47.09220913 ... 59.98747159 15.8384598
59.98747159]

C = linkage(X, 'complete')
from scipy.cluster.hierarchy import cophenet
from scipy.spatial.distance import pdist

c, coph_dists = cophenet(C, pdist(X))

print('The cophentic correlation distance for complete method ', c)
print(' The cophenetic distance matrix in condensed form for complete
method ', coph_dists)

The cophentic correlation distance for complete method

0.6793512047747837
The cophenetic distance matrix in condensed form for complete method
[ 96.02603814 39.39543121 96.02603814 ... 101.41498903 17.4642492
101.41498903]

S = linkage(X, 'single')
from scipy.cluster.hierarchy import cophenet
from scipy.spatial.distance import pdist

c, coph_dists = cophenet(S, pdist(X))

print('The cophentic correlation distance for single method ', c)
print(' The cophenetic distance matrix in condensed form for single
method ', coph_dists)

The cophentic correlation distance for single method

0.7230703278062255
The cophenetic distance matrix in condensed form for single method [
9.43398113 9.48683298 9.43398113 ... 14.86606875 14.2126704
14.86606875]

data.isnull().sum()
# Fitting Hierarchical Clustering to the dataset
from sklearn.cluster import AgglomerativeClustering
hc = AgglomerativeClustering(n_clusters = 5, affinity = 'euclidean',
linkage = 'single')
y_hc = hc.fit_predict(X)
C:\Users\Shyam Singh\anaconda3\lib\site-packages\sklearn\cluster\
_agglomerative.py:983: FutureWarning: Attribute `affinity` was
deprecated in version 1.2 and will be removed in 1.4. Use `metric`
instead
warnings.warn(

print(y_hc)

print(y_hc)
# Visualising the clusters
plt.scatter(X[:,0], X[:,1], s = 100, c = 'black', label = 'Data
Distribution')
plt.title('Customer Distribution before clustering')
plt.xlabel('Annual Income (k$)')
plt.ylabel('Spending Score (1-100)')
plt.legend()
plt.show()

[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 0 1 0 4 0 4 3 2]
# Visualising the clusters
plt.scatter(X[y_hc == 0, 0], X[y_hc == 0, 1], s = 100, c = 'red',
label = 'Careless')
plt.scatter(X[y_hc == 1, 0], X[y_hc == 1, 1], s = 100, c = 'blue',
label = 'standard')
plt.scatter(X[y_hc == 2, 0], X[y_hc == 2, 1], s = 100, c = 'green',
label = 'Target')
plt.scatter(X[y_hc == 3, 0], X[y_hc == 3, 1], s = 100, c = 'cyan',
label = 'Careful')
plt.scatter(X[y_hc== 4, 0], X[y_hc == 4, 1], s = 100, c = 'magenta',
label = 'Sensible')
plt.title('Clusters of customers')
plt.show()
# Fitting Hierarchical Clustering to the dataset
from sklearn.cluster import AgglomerativeClustering
hc = AgglomerativeClustering(n_clusters = 5, affinity = 'euclidean',
linkage = 'ward')
y_hc = hc.fit_predict(X)

C:\Users\Shyam Singh\anaconda3\lib\site-packages\sklearn\cluster\
_agglomerative.py:983: FutureWarning: Attribute `affinity` was
deprecated in version 1.2 and will be removed in 1.4. Use `metric`
instead
warnings.warn(

print(y_hc)

[4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4 3 4
3 4
3 4 3 4 3 4 1 4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1
1 1 1 1 1 1 1 1 1 1 1 1 2 1 2 1 2 0 2 0 2 1 2 0 2 0 2 0 2 0 2 1 2 0 2
1 2
0 2 0 2 0 2 0 2 0 2 0 2 1 2 0 2 0 2 0 2 0 2 0 2 0 2 0 2 0 2 0 2 0 2 0
2 0
2 0 2 0 2 0 2 0 2 0 2 0 2 0 2]
# Visualising the clusters
plt.scatter(X[y_hc == 0, 0], X[y_hc == 0, 1], s = 100, c = 'red',
label = 'Careless')
plt.scatter(X[y_hc == 1, 0], X[y_hc == 1, 1], s = 100, c = 'blue',
label = 'standard')
plt.scatter(X[y_hc == 2, 0], X[y_hc == 2, 1], s = 100, c = 'green',
label = 'Target')
plt.scatter(X[y_hc == 3, 0], X[y_hc == 3, 1], s = 100, c = 'cyan',
label = 'Careful')
plt.scatter(X[y_hc== 4, 0], X[y_hc == 4, 1], s = 100, c = 'magenta',
label = 'Sensible')
plt.title('Clusters of customers')
plt.show()

Annual_Income = 39
Spending_Score = 91
Annual_Income1 = 34
Spending_Score1 = 19
Annual_Income2 = 34
Spending_Score2 = 65
Annual_Income3 = 45
Spending_Score3 = 56
Annual_Income4 = 56
Spending_Score4 = 21
predict= hc.fit_predict([[ Annual_Income,Spending_Score ],
[ Annual_Income1,Spending_Score1 ],
[ Annual_Income2,Spending_Score2 ], [ Annual_Income3,Spending_Score3],
[ Annual_Income4,Spending_Score4 ]])
print(predict)

[2 3 4 1 0]

import pickle
filename = "model8.sav"
pickle.dump(hc, open(filename, "wb"))

ML Lab Exp 7 K-Means Clustering
No ratings yet
ML Lab Exp 7 K-Means Clustering
14 pages
Assignment5 VidulGarg
No ratings yet
Assignment5 VidulGarg
12 pages
Practical 4
No ratings yet
Practical 4
9 pages
K NN Regression
No ratings yet
K NN Regression
12 pages
Numpy
No ratings yet
Numpy
13 pages
Building Classification Model 23rd - June PDF
No ratings yet
Building Classification Model 23rd - June PDF
12 pages
DSBDA5
No ratings yet
DSBDA5
10 pages
Project 13 Customer Segmentation Using K Means Clustering
No ratings yet
Project 13 Customer Segmentation Using K Means Clustering
9 pages
K - Means - Clustering - Ipynb - Colaboratory
No ratings yet
K - Means - Clustering - Ipynb - Colaboratory
2 pages
1 Simple Linear Regression
No ratings yet
1 Simple Linear Regression
9 pages
Logistic Regression PRGM
No ratings yet
Logistic Regression PRGM
1 page
1168 - 881
No ratings yet
1168 - 881
7 pages
Roulette Algorithm Pro Guide
No ratings yet
Roulette Algorithm Pro Guide
3 pages
Neural Network Handwritten Digit Prediction 1
No ratings yet
Neural Network Handwritten Digit Prediction 1
5 pages
Neural Network Handwritten Digit Prediction
No ratings yet
Neural Network Handwritten Digit Prediction
6 pages
MNIST Digit Classification Guide
No ratings yet
MNIST Digit Classification Guide
53 pages
TP Debug Info
No ratings yet
TP Debug Info
3 pages
IMg Process
No ratings yet
IMg Process
30 pages
MLLab 4
No ratings yet
MLLab 4
9 pages
Lotto
No ratings yet
Lotto
16 pages
Untitled10 - Jupyter Notebook
No ratings yet
Untitled10 - Jupyter Notebook
9 pages
Numpy Numpy NP NP: Mylist (, ,)
No ratings yet
Numpy Numpy NP NP: Mylist (, ,)
33 pages
CISC 504 - Vatsal - Patel - Assignment 5 - O.ipynb
No ratings yet
CISC 504 - Vatsal - Patel - Assignment 5 - O.ipynb
27 pages
DeepLearning Lect4
No ratings yet
DeepLearning Lect4
23 pages
CISC 504 Assignment 5 - O
No ratings yet
CISC 504 Assignment 5 - O
7 pages
TP Debug Info
No ratings yet
TP Debug Info
14 pages
Lab Handwritten
No ratings yet
Lab Handwritten
8 pages
Touch Panel Debug Data
No ratings yet
Touch Panel Debug Data
10 pages
SVM Practical ML4
No ratings yet
SVM Practical ML4
1 page
Touchpanel Debug Info 2025-02-25
No ratings yet
Touchpanel Debug Info 2025-02-25
6 pages
Data Analytics II
No ratings yet
Data Analytics II
16 pages
TP Debug Info
No ratings yet
TP Debug Info
9 pages
TP Debug Info
No ratings yet
TP Debug Info
21 pages
TP Debug Info
No ratings yet
TP Debug Info
491 pages
Kelompok 7
No ratings yet
Kelompok 7
15 pages
TP Debug Info
No ratings yet
TP Debug Info
13 pages
Implement SOFM For Character Recognition - Watermark
No ratings yet
Implement SOFM For Character Recognition - Watermark
9 pages
Tapa Trias
0% (1)
Tapa Trias
15,540 pages
Pandas Practice
No ratings yet
Pandas Practice
45 pages
Untitled 21
No ratings yet
Untitled 21
6 pages
Numbers
No ratings yet
Numbers
13 pages
TP Debug Info
No ratings yet
TP Debug Info
3 pages
TP Debug Info
No ratings yet
TP Debug Info
56 pages
Touch Panel Debug Data Analysis
No ratings yet
Touch Panel Debug Data Analysis
134 pages
Python Assignment: #Source Code
No ratings yet
Python Assignment: #Source Code
11 pages
Mommy Long Legs - Melsave
No ratings yet
Mommy Long Legs - Melsave
172 pages
TP Debug Infobb
No ratings yet
TP Debug Infobb
8 pages
Tickets Aleatórios
No ratings yet
Tickets Aleatórios
2 pages
TP Debug Info
No ratings yet
TP Debug Info
793 pages
TP Debug Info
No ratings yet
TP Debug Info
30 pages
TP Debug Info
No ratings yet
TP Debug Info
2,828 pages
TP Debug Info
No ratings yet
TP Debug Info
30 pages
TP Debug Info
No ratings yet
TP Debug Info
8 pages
Gray
No ratings yet
Gray
4 pages
TP Debug Info
No ratings yet
TP Debug Info
3 pages
TP Debug Info
No ratings yet
TP Debug Info
5 pages
TP Debug Info
No ratings yet
TP Debug Info
29 pages
TP Debug Info
No ratings yet
TP Debug Info
115 pages
TP Debug Info
No ratings yet
TP Debug Info
10 pages
Prediction of Heart Disease Using Random Forest in Comparison With Logistic Regression To Measure Accuracy
No ratings yet
Prediction of Heart Disease Using Random Forest in Comparison With Logistic Regression To Measure Accuracy
5 pages
Heart Disease Prediction Using Hybrid Machine Learning Model
No ratings yet
Heart Disease Prediction Using Hybrid Machine Learning Model
5 pages
Heart Disease Prediction Using Supervised Machine Learning Algorithms
No ratings yet
Heart Disease Prediction Using Supervised Machine Learning Algorithms
3 pages
Some SQL Functions
No ratings yet
Some SQL Functions
10 pages
Dbscan Clustering 1
No ratings yet
Dbscan Clustering 1
10 pages
KDD Cup 2009 - Customer Relationship Prediction - Sig KDD
No ratings yet
KDD Cup 2009 - Customer Relationship Prediction - Sig KDD
8 pages
AAM Practicals 6-10
No ratings yet
AAM Practicals 6-10
13 pages
Clustering & Association Algorithms 4
No ratings yet
Clustering & Association Algorithms 4
17 pages
Master Thesis Machine Design
100% (3)
Master Thesis Machine Design
8 pages
Data Mining Primitives Guide
No ratings yet
Data Mining Primitives Guide
30 pages
Data Mining and Decision Making
No ratings yet
Data Mining and Decision Making
11 pages
Data Science Student Projects
No ratings yet
Data Science Student Projects
1 page
Data Mining Model Qns
100% (1)
Data Mining Model Qns
14 pages
France Ghose 2018 Marketing Analytics PDF
No ratings yet
France Ghose 2018 Marketing Analytics PDF
32 pages
Data Analytics 2marks PDF
100% (1)
Data Analytics 2marks PDF
13 pages
Business Intelligence Essentials
No ratings yet
Business Intelligence Essentials
18 pages
Multi-Layer Perceptron Guide
No ratings yet
Multi-Layer Perceptron Guide
16 pages
Data Mining Techniques Guide
No ratings yet
Data Mining Techniques Guide
17 pages
00 Introduction
No ratings yet
00 Introduction
14 pages
K-Means Clustering Algorithm
No ratings yet
K-Means Clustering Algorithm
40 pages
Data Science Is New-Age Astrology: Astrology and Machine Learning
No ratings yet
Data Science Is New-Age Astrology: Astrology and Machine Learning
6 pages
MCA III Year I Semester Syllabus
No ratings yet
MCA III Year I Semester Syllabus
12 pages
Introduction To SMAC Social Mobile Analytics and Cloud
No ratings yet
Introduction To SMAC Social Mobile Analytics and Cloud
3 pages
Data Management TURBAN
No ratings yet
Data Management TURBAN
39 pages
Deep Learning - Chorale Prelude
No ratings yet
Deep Learning - Chorale Prelude
2 pages
1 - Heart Disease Prediction Using Machine Learning
81% (27)
1 - Heart Disease Prediction Using Machine Learning
59 pages
01 Business Intelligence
100% (1)
01 Business Intelligence
16 pages
DM Batch 1 Combined
0% (1)
DM Batch 1 Combined
400 pages
Machine Learning (BTCOC603 - Y23) Supplementary December 2024
No ratings yet
Machine Learning (BTCOC603 - Y23) Supplementary December 2024
4 pages
Brochure Modulus Final
No ratings yet
Brochure Modulus Final
23 pages
DB Scan
No ratings yet
DB Scan
7 pages
Data Warehousing & Mining Exam 2008
No ratings yet
Data Warehousing & Mining Exam 2008
5 pages
Digital Audit: Governance Impact
No ratings yet
Digital Audit: Governance Impact
10 pages
Data Mining CSE 5310 Note Uzzal Da.
100% (3)
Data Mining CSE 5310 Note Uzzal Da.
28 pages

Experiment 8 Heirarchical Clustering

Uploaded by

Experiment 8 Heirarchical Clustering

Uploaded by

import pandas as pd

CustomerID Genre Age Annual Income (k$) Spending Score (1-100)

#Count total number of classes in Data

# Extracting features of dataset

array([[ 15, 39],

# Using the dendrogram to find the optimal number of clusters

# Using the dendrogram to find the optimal number of clusters

# cophetic distance between two observation that have been cluster is

from scipy.cluster.hierarchy import cophenet

c, coph_dists = cophenet(Z, pdist(X))

The cophentic correlation distance for ward method 0.7179298392392908

c, coph_dists = cophenet(A, pdist(X))

The cophentic correlation distance for average method

c, coph_dists = cophenet(C, pdist(X))

The cophentic correlation distance for complete method

c, coph_dists = cophenet(S, pdist(X))

The cophentic correlation distance for single method

You might also like