0% found this document useful (0 votes)

46 views18 pages

Clustering

This document discusses different types of clustering methods for data mining including partitioning methods like k-means and k-medoids, hierarchical clustering, grid-based clustering, density-based clustering like DBSCAN and DENCLUE, and probabilistic clustering methods. It provides details on how several of these methods work and their features.

Uploaded by

pppchan23100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

46 views18 pages

Clustering

Uploaded by

pppchan23100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Clustering

Data Mining:
Data Mining Methods
with Dr. Qin Lv
Learning objective: Apply techniques
for clustering and explain how they work.
Evaluate and compare methods.
Clustering
Ø No predefined
classes
Ø Intra-cluster
similarity
Ø Inter-cluster
dissimilarity
Cluster Analysis
Ø Unsupervised learning
• Group similar objects into clusters
Ø Similarity measure
• Types of objects, similarity/dissimilarity
Ø Clustering method
• Quality, efficiency, incremental
Cluster Evaluation
Ø Clustering tendency
Ø Cluster cohesion & separation
Ø #clusters (e.g., silhouette coefficient)
Ø Comparison with external knowledge
Ø Comparison of two sets of clusters
Types of Clustering Methods
Ø Partitioning methods
Ø Hierarchical methods
Ø Grid-based methods
Ø Density-based methods
Ø Probabilistic methods
Partitioning Methods
Ø Given n objects and #clusters k
• Partition the n objects into k clusters
Ø Brute force approach
• Enumerate all possible partitions
Ø Heuristic methods
• k-means: cluster centroid (mean of objects)
• k-medoids: cluster medoid (“central” object)
k-means Clustering: Method
Ø 1. Pick k initial centroids (e.g., randomly)
Ø 2. Assign each object to nearest centroid
Ø 3. Update each centroid based on objects
assigned to its cluster
Ø Repeat 2. & 3. until centroids are stable
Ø O(nkt): n objects, k clusters, t iterations
k-means Clustering: Example
Ø 10 objects: {35, 69, 9, 78, 9, 23, 81, 57, 15, 48}.
Ø 2 initial centroids: 30, 60
Ø Sort: {9, 9, 15, 23, 35, 48, 57, 69, 78, 81}
Ø R1: 30 {9, 9, 15, 23, 35}, 60 {48, 57, 69, 78, 81}
Ø C_1 = (9 + 9 + 15 + 23 + 35) / 5 = 18.2
Ø C_2 = (48 + 57 + 69 + 78 + 81) / 5 = 66.6
Ø R2: 18.2 {9, 9, 15, 23, 35}, 66.6 {48, 57, 69, 78, 81}
k-means Clustering: Features
Ø Widely-used, efficient and good results
Ø Need to specify k & define centroid
Ø Choice of initial centroids
Ø Not suitable for non-convex shapes
Ø Sensitive to noise & outliers
k-medoids Clustering
Ø Similar process as k-means
Ø Cluster medoid: “central” object
Ø Less sensitive to noise & outliers
Ø Medoid update: computation expensive
Ø Speedup using randomized samples
Hierarchical Clustering: Method
Ø Dendrogram
• Tree of clusters
Ø Agglomerative
• Bottom-up merging
Ø Decisive
• Top-down splitting
Hierarchical Clustering: Features
Ø Useful in many real-world applications
Ø No need to specify #clusters
Ø Need to define cluster distance
Ø Multi-level clustering
Ø Cannot undo cluster merge/split
Grid-based Clustering
Ø Multi-resolution grid structure
• Clusters of different resolutions
• Horizonal & vertical cluster boundaries
Ø Object space => grid cells
• Depends on #cells, easy to parallelize
Ø Statistical information of grid cells
• Incremental processing
Density-based Clustering
Ø Local clusters with high density
• DBSCAN: connected dense neighborhood
• DENCLUE: sum of local influence functions
Ø Key features
• Arbitrary cluster shape, noise tolerant
• Single scan, adjustable density parameters
DBSCAN
Ø Two key parameters
• ε-neighborhood: within radius ε of p
• MinPts: min #points in p’s ε-neighborhood
for p to be considered a core object
Ø Clustering
• Core objects, border objects
• Density-connected, density-reachable
DENCLUE
Ø Influence function
• Object’s impact in its neighborhood
Ø Overall density
• Sum of all objects’ influence function
Ø Density attractors
• Clusters correspond to local maxima
Types of Clustering Methods
Ø Partitioning methods
Ø Hierarchical methods
Ø Grid-based methods
Ø Density-based methods
Ø Probabilistic methods

Clustering
No ratings yet
Clustering
89 pages
(3rd Year) Pattern REcognition Lecture 4
No ratings yet
(3rd Year) Pattern REcognition Lecture 4
48 pages
IT3080 Lecture04 2023
No ratings yet
IT3080 Lecture04 2023
56 pages
05 Clustering
No ratings yet
05 Clustering
96 pages
Data Mining Clustering
No ratings yet
Data Mining Clustering
76 pages
DWMModule 4
No ratings yet
DWMModule 4
31 pages
Clustering
No ratings yet
Clustering
25 pages
Lecture 8 - Clustering
No ratings yet
Lecture 8 - Clustering
23 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
42 pages
Lecture 3.2.3 3.2.4
No ratings yet
Lecture 3.2.3 3.2.4
28 pages
Cluster Analysis
No ratings yet
Cluster Analysis
21 pages
Cluster
No ratings yet
Cluster
20 pages
Unit 5
No ratings yet
Unit 5
85 pages
Unit IV
No ratings yet
Unit IV
96 pages
Clustering
No ratings yet
Clustering
104 pages
Data Mining - Lecture 9
No ratings yet
Data Mining - Lecture 9
29 pages
Fundamentals of Data Science Unit 3
No ratings yet
Fundamentals of Data Science Unit 3
15 pages
Cluster Analysis and Methods Overview
No ratings yet
Cluster Analysis and Methods Overview
47 pages
L07 - Advance Analytical Theory and Methods - Clustering
No ratings yet
L07 - Advance Analytical Theory and Methods - Clustering
22 pages
A Short Review On Different Clustering Techniques and Their Applications
No ratings yet
A Short Review On Different Clustering Techniques and Their Applications
15 pages
Cluster Analysis for Researchers
No ratings yet
Cluster Analysis for Researchers
76 pages
Chapter 5. Clustering Algorithms-Stud
No ratings yet
Chapter 5. Clustering Algorithms-Stud
44 pages
Clustering
No ratings yet
Clustering
32 pages
Introduction To Cluster Analysis.
No ratings yet
Introduction To Cluster Analysis.
53 pages
Clustering-Part 1
No ratings yet
Clustering-Part 1
35 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
101 pages
Unit 2 ML
No ratings yet
Unit 2 ML
11 pages
Cluster Analysis: Basic Concepts Partitioning Methods Hierarchical Methods Density-Based Methods Grid-Based Methods Evaluation of Clustering
No ratings yet
Cluster Analysis: Basic Concepts Partitioning Methods Hierarchical Methods Density-Based Methods Grid-Based Methods Evaluation of Clustering
38 pages
Clustering
No ratings yet
Clustering
24 pages
Clustering K Means Agnes
No ratings yet
Clustering K Means Agnes
36 pages
Clustering
No ratings yet
Clustering
7 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
101 pages
Unit - 5 Cluster Analysis
No ratings yet
Unit - 5 Cluster Analysis
83 pages
1 ST
No ratings yet
1 ST
11 pages
Clustering
No ratings yet
Clustering
45 pages
10clustering - Han and Kamber
No ratings yet
10clustering - Han and Kamber
93 pages
Lect 10 DM
No ratings yet
Lect 10 DM
36 pages
Chapter 3 Unsupervised Learning
No ratings yet
Chapter 3 Unsupervised Learning
45 pages
Cluster Analysis for CS Students
No ratings yet
Cluster Analysis for CS Students
43 pages
10 Clus Basic
No ratings yet
10 Clus Basic
31 pages
Custer Analysis: Prepared by Navin Ninama
No ratings yet
Custer Analysis: Prepared by Navin Ninama
20 pages
Partition
No ratings yet
Partition
52 pages
Cluster Analysis: G Sreenivas
No ratings yet
Cluster Analysis: G Sreenivas
29 pages
Clustering
No ratings yet
Clustering
125 pages
Concepts and Techniques: - Chapter 10
No ratings yet
Concepts and Techniques: - Chapter 10
97 pages
10 Clus Basic
No ratings yet
10 Clus Basic
95 pages
Clustering
No ratings yet
Clustering
41 pages
ML Unit III
No ratings yet
ML Unit III
82 pages
Machine Learning Unit-4
No ratings yet
Machine Learning Unit-4
24 pages
Unit 2 DMW
No ratings yet
Unit 2 DMW
26 pages
Clustering
No ratings yet
Clustering
11 pages
Unit 5
No ratings yet
Unit 5
10 pages
Module 5
No ratings yet
Module 5
43 pages
Clustering Explanation
No ratings yet
Clustering Explanation
8 pages
Clustering Data Mining
No ratings yet
Clustering Data Mining
27 pages
Clustering and K-Means Algorithm
No ratings yet
Clustering and K-Means Algorithm
81 pages
ML - 8
No ratings yet
ML - 8
70 pages
Slide-08-Chapter10-Cluster Analysis Basic Concept I
No ratings yet
Slide-08-Chapter10-Cluster Analysis Basic Concept I
40 pages
Department of Software Engineering COURSE TITLE: - Statistics and Probability Course Code: - Sweg2101
No ratings yet
Department of Software Engineering COURSE TITLE: - Statistics and Probability Course Code: - Sweg2101
7 pages
Cse2021 2
No ratings yet
Cse2021 2
3 pages
Sharda 11e Full Accessible PPT 04
No ratings yet
Sharda 11e Full Accessible PPT 04
40 pages
Chapter 14 Big Data and Data Science - DONE DONE DONE
No ratings yet
Chapter 14 Big Data and Data Science - DONE DONE DONE
28 pages
BDA Worksheet 5 Arman
No ratings yet
BDA Worksheet 5 Arman
5 pages
ML Links
No ratings yet
ML Links
176 pages
DWDM Question Bank (R23)
100% (1)
DWDM Question Bank (R23)
6 pages
DATA Ware House Mining NOTES
No ratings yet
DATA Ware House Mining NOTES
31 pages
Data Mining: Concepts and Techniques: - Chapter 1
No ratings yet
Data Mining: Concepts and Techniques: - Chapter 1
29 pages
Lesson Three Mis
No ratings yet
Lesson Three Mis
15 pages
Question Bank
No ratings yet
Question Bank
20 pages
Dwdmunit2 Assoc
No ratings yet
Dwdmunit2 Assoc
55 pages
Project Report Soft
No ratings yet
Project Report Soft
123 pages
Hierarchical Cluster Analysis 1
No ratings yet
Hierarchical Cluster Analysis 1
13 pages
ME CSE Data Warehousing Course Plan
No ratings yet
ME CSE Data Warehousing Course Plan
4 pages
ML Lab Assignment 1
No ratings yet
ML Lab Assignment 1
1 page
Clustering Before Classification
No ratings yet
Clustering Before Classification
3 pages
Data Mining What Is Data Mining?
No ratings yet
Data Mining What Is Data Mining?
11 pages
1.1 What Is Data Mining?
No ratings yet
1.1 What Is Data Mining?
6 pages
Social Networks Conference CFP
No ratings yet
Social Networks Conference CFP
1 page
PHD Thesis in Computer Science in India PDF
100% (3)
PHD Thesis in Computer Science in India PDF
6 pages
Business Intelligence & Databases Quiz
No ratings yet
Business Intelligence & Databases Quiz
18 pages
Market Basket Analysis For Data Mining Concepts and Techniques
No ratings yet
Market Basket Analysis For Data Mining Concepts and Techniques
4 pages
Artificial Neural Network-Adaline & Madaline
No ratings yet
Artificial Neural Network-Adaline & Madaline
18 pages
(Ebook PDF) Health Informatics: A Systems Perspective, Second Edition Download
No ratings yet
(Ebook PDF) Health Informatics: A Systems Perspective, Second Edition Download
35 pages
Association Rule Mining Guide
No ratings yet
Association Rule Mining Guide
88 pages
IEEE Project
No ratings yet
IEEE Project
26 pages
Spatiotemporal Data Mining
No ratings yet
Spatiotemporal Data Mining
27 pages
A Combined Mining Based Framework For Predicting Telecommunications Customer Payment Behaviors
No ratings yet
A Combined Mining Based Framework For Predicting Telecommunications Customer Payment Behaviors
9 pages
Stock Market Prediction
100% (1)
Stock Market Prediction
22 pages

Clustering

Uploaded by

Clustering

Uploaded by

Clustering

You might also like