Data Mining Methods

The document provides an introduction to data mining methods, covering topics such as frequent pattern analysis, classification, clustering, anomaly detection, and trend analysis. It describes the Apriori algorithm for frequent itemset mining and provides an example of how it works by generating candidate itemsets and pruning infrequent ones.

Uploaded by

pppchan23100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views18 pages

Data Mining Methods

Uploaded by

pppchan23100

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Introduction to

Data Mining Methods

Data Mining:
Data Mining Methods
with Dr. Qin Lv
Learning objective: Identify the core
functionalities of data modeling in the
data mining pipeline. Apply the Apriori
algorithm for frequent itemset mining.
Data Mining: Four Views
Application

Knowledge Technique

Data
Application
Data Mining Pipeline
Knowledge
Pattern
evaluation

Data modeling

Data
warehousing
Technique
Data
preprocessing

Data
understanding

Data
Technique View
Ø Frequent pattern analysis
Ø Classification, prediction
Ø Clustering
Ø Anomaly detection
Ø Trend and evolution analysis
Frequent Pattern
Analysis
Ø Frequent itemset
Ø Frequent sequence
Ø Frequent structure
Ø Association rules
Ø Correlation analysis
Classification
Ø Pre-defined
classes
Ø Need training data
Ø Build model to
distinguish classes
Prediction
Ø Numerical prediction
(continuous value)
• E.g., weather
• E.g., stock price
• E.g., traffic
Clustering
Ø No predefined
classes
Ø Intra-cluster
similarity
Ø Inter-cluster
dissimilarity
Anomaly Detection
280

Ø Anomaly/outlier 260 Unusual Time

Series Snippets Level Shifting

• Differ from the “norm” 240

Kelvin
• E.g., error, noise 220

• E.g., fraud 200

• E.g., extreme events 180

160
199 200 200 200 200 200
8-0 0-0 1-0 2-1 4-0 5-0
9-1 1-3 6-1 0-2 3-1 7-2
8 1 5 8 1 4
Date (yyyy-mm-dd)
Trend and Evolution Analysis
Ø Changes over time
• Overall trend
• Periodical patterns
• Anomalies
• E.g.,
Data Mining Methods
Ø Frequent pattern analysis
Ø Classification
Ø Clustering
Ø Outlier analysis
Market Basket Analysis
Tid Items
Ø List of transactions
1 A, B, C, E
• Each Ti contains multiple items
2 A, D, E
Ø (Frequent) itemset
• X = {x1, x2, …, xk} 3 B, C, E

Ø (Minimum) support 4 B, C, D, E
• Probability of Ti containing X 5 B, D, E
Frequent Pattern Mining
Ø Brute force approach (e.g., 100 items)

Ø Closed pattern X: no super-pattern Y ⊃ X

w/ the same support
Ø Max-pattern X: no super-pattern Y ⊃ X
Closed & Max Pattern Example
Ø {<a1, ..., a100>, <a1, ..., a50>} min_sup = 0.5
Ø Frequent pattern? all item combinations
Ø Closed pattern?
• <a1, ..., a100>: 1; <a1, ..., a50>: 2
Ø Max-pattern?
• <a1, ..., a100>: 1
Apriori Algorithm
Ø Apriori pruning: if X is infrequent, then any
of its superset cannot be frequent
Ø Procedure
• Scan dataset to get freq. 1-itemsets
• Generate candidate (k+1)-itemsets from freq. k-itemsets
• Scan dataset to remove infreq. candidate (k+1)-itemsets
• Stop when no more freq. or candidate itemsets
Itemset #
Apriori Algorithm Example {B, C} 3
What about {B, D, E} {B, D} 2
Ø min_sup = 0.6 or {C, D, E}?
{B, E} 4
Tid Items Itemset #
{C, D} 1
1 A, B, C, E {A} 2
{C, E} 3
2 A, D, E {B} 4
{D, E} 3
3 B, C, E {C} 3
4 B, C, D, E {D} 3 Itemset #
5 B, D, E {E} 5 {B, C, E} 3
Important Details
Ø Self-joining of k-itemsets => (k+1)-itemsets
• Only join if their first (k-1) items are the same
Ø Pruning: remove if subset is not frequent
Ø Example: L3 = {abc, abd, acd, ace, bcd}
• abc and abd => abcd and bcd is in L3 => valid candidate
• acd and ace => acde but ade is not in L3 => pruned

Apriori Algorithm in Data Mining
No ratings yet
Apriori Algorithm in Data Mining
8 pages
Unit3 Data Mining Pattern
No ratings yet
Unit3 Data Mining Pattern
46 pages
DATA MINING UNIT 4-Association Rules
No ratings yet
DATA MINING UNIT 4-Association Rules
10 pages
Mod 3 Notes Full
No ratings yet
Mod 3 Notes Full
25 pages
Unit-4 Da
No ratings yet
Unit-4 Da
15 pages
What Is A Frequent Itemset?
No ratings yet
What Is A Frequent Itemset?
7 pages
DMDW Chapter 4
No ratings yet
DMDW Chapter 4
29 pages
Unit IV DWDM
No ratings yet
Unit IV DWDM
17 pages
DM 2
No ratings yet
DM 2
71 pages
APRIORI Algorithm: Professor Anita Wasilewska Lecture Notes
No ratings yet
APRIORI Algorithm: Professor Anita Wasilewska Lecture Notes
23 pages
APRIORI Algorithm: Professor Anita Wasilewska Lecture Notes
No ratings yet
APRIORI Algorithm: Professor Anita Wasilewska Lecture Notes
23 pages
Data Mining Unit-III
No ratings yet
Data Mining Unit-III
24 pages
Apriori Algo
No ratings yet
Apriori Algo
15 pages
Data Mining Patterns & Techniques
No ratings yet
Data Mining Patterns & Techniques
16 pages
APRIORI Algorithm: Professor Anita Wasilewska Book Slides
No ratings yet
APRIORI Algorithm: Professor Anita Wasilewska Book Slides
23 pages
Mining Association Rules in Large Databases
No ratings yet
Mining Association Rules in Large Databases
77 pages
Apriori Algorithm Example PDF
No ratings yet
Apriori Algorithm Example PDF
7 pages
(2025-05-27) - FPM - Lecture 9
No ratings yet
(2025-05-27) - FPM - Lecture 9
35 pages
Apriori Algorithm in Data Mining
No ratings yet
Apriori Algorithm in Data Mining
23 pages
Performance Analysis of Distributed Association Rule Mining With Apriori Algorithm
No ratings yet
Performance Analysis of Distributed Association Rule Mining With Apriori Algorithm
5 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
99 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
94 pages
DWDM - Unit - IV
No ratings yet
DWDM - Unit - IV
67 pages
Explain Architecture of Data Mining
No ratings yet
Explain Architecture of Data Mining
12 pages
U2 - Apriori - 5th Sem - DS
No ratings yet
U2 - Apriori - 5th Sem - DS
12 pages
KDDM-Lecture 3
No ratings yet
KDDM-Lecture 3
21 pages
Association Rule-A Tool For Data Mining: Praveen Ranjan Srivastava
No ratings yet
Association Rule-A Tool For Data Mining: Praveen Ranjan Srivastava
6 pages
Chapter06 (Frequent Patterns)
No ratings yet
Chapter06 (Frequent Patterns)
47 pages
Data Mining: Magister Teknologi Informasi Universitas Indonesia
No ratings yet
Data Mining: Magister Teknologi Informasi Universitas Indonesia
72 pages
Association Rules
No ratings yet
Association Rules
48 pages
Mining Association Rules in Large Databases
No ratings yet
Mining Association Rules in Large Databases
40 pages
Data Mining Notes UNIT III
No ratings yet
Data Mining Notes UNIT III
26 pages
Module 5.1 - Association Rule Mining, Apriori Algorithm, Data Mining, Support, Confidence, Examples
100% (1)
Module 5.1 - Association Rule Mining, Apriori Algorithm, Data Mining, Support, Confidence, Examples
108 pages
Shweta Singh-Dwdm2024
No ratings yet
Shweta Singh-Dwdm2024
5 pages
Assoc 1
No ratings yet
Assoc 1
26 pages
Fundamentals of Data Science Unit 5
No ratings yet
Fundamentals of Data Science Unit 5
25 pages
Data Mining Module 4 Important Topics PYQs
No ratings yet
Data Mining Module 4 Important Topics PYQs
31 pages
DMDW Chapter 4
No ratings yet
DMDW Chapter 4
28 pages
Association Rule Mining Guide
No ratings yet
Association Rule Mining Guide
16 pages
Association Rules
No ratings yet
Association Rules
20 pages
Apriori & Association Rule Mining
No ratings yet
Apriori & Association Rule Mining
26 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
10 pages
11 Association Rules Mining New
No ratings yet
11 Association Rules Mining New
32 pages
Data Mining: Frequent Patterns
No ratings yet
Data Mining: Frequent Patterns
40 pages
DMDW Chapter 4 (Updated)
No ratings yet
DMDW Chapter 4 (Updated)
28 pages
CSC 452 DM Week06 Association Rules 26102020 111149am
No ratings yet
CSC 452 DM Week06 Association Rules 26102020 111149am
52 pages
Frequent Pattern Mining Techniques
No ratings yet
Frequent Pattern Mining Techniques
59 pages
Mining Frequent Patterns and Associations
No ratings yet
Mining Frequent Patterns and Associations
52 pages
2 Unit DM K Raj Kuamr
No ratings yet
2 Unit DM K Raj Kuamr
26 pages
A Review Paper of Association Rule Mining Using Apriori Algorithm
No ratings yet
A Review Paper of Association Rule Mining Using Apriori Algorithm
3 pages
FP Tree Basics
No ratings yet
FP Tree Basics
67 pages
SE 458 - Data Mining (DM) : Spring 2019 Section W1
No ratings yet
SE 458 - Data Mining (DM) : Spring 2019 Section W1
20 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
9 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
4 pages
PROFICIENCY Data Mining
No ratings yet
PROFICIENCY Data Mining
6 pages
FALLSEM2022-23 SWE2009 ETH VL2022230101117 Reference Material I 25-08-2022 Frequent Pattern Mining
No ratings yet
FALLSEM2022-23 SWE2009 ETH VL2022230101117 Reference Material I 25-08-2022 Frequent Pattern Mining
42 pages
Razul Data Ipasa Karun Kay Jebu Tambok
No ratings yet
Razul Data Ipasa Karun Kay Jebu Tambok
3 pages
Taxonomic Studies of Trees of The Cholistan Desert, Pakistan
No ratings yet
Taxonomic Studies of Trees of The Cholistan Desert, Pakistan
8 pages
Biology Test Bioenergetics
No ratings yet
Biology Test Bioenergetics
1 page
Anatomical Terms and Planes Guide
100% (1)
Anatomical Terms and Planes Guide
24 pages
Analysis of Ethoxyquin and Its Metabolites PDF
No ratings yet
Analysis of Ethoxyquin and Its Metabolites PDF
1 page
Lecture 5 - Modes of Life
No ratings yet
Lecture 5 - Modes of Life
15 pages
Microbial Insecticides: R. Weinzierl, T. Henn, P. G. Koehler and C. L. Tucker
No ratings yet
Microbial Insecticides: R. Weinzierl, T. Henn, P. G. Koehler and C. L. Tucker
13 pages
VESERAB
No ratings yet
VESERAB
3 pages
221PG01008 - Narra Naga Pavan Kumar
No ratings yet
221PG01008 - Narra Naga Pavan Kumar
7 pages
Gujarat Technological University: W.E.F. AY 2020-21
No ratings yet
Gujarat Technological University: W.E.F. AY 2020-21
3 pages
Biology Notes Chap 3.PDF Grade 9th
No ratings yet
Biology Notes Chap 3.PDF Grade 9th
5 pages
Microscope TeacherNotes
No ratings yet
Microscope TeacherNotes
4 pages
Enzyme Function and Homeostasis
No ratings yet
Enzyme Function and Homeostasis
42 pages
Wiley - Principles of Human Anatomy, 14th Edition - 978-1-119-44446-6
0% (1)
Wiley - Principles of Human Anatomy, 14th Edition - 978-1-119-44446-6
3 pages
Max Brooks - The Zombie Survival Guide (Scanned Book)
88% (8)
Max Brooks - The Zombie Survival Guide (Scanned Book)
270 pages
Borges Et Al. (2022) Marine or Freshwater
No ratings yet
Borges Et Al. (2022) Marine or Freshwater
23 pages
Embryology: Development Stages Explained
No ratings yet
Embryology: Development Stages Explained
144 pages
Alwin Fill Peter Muhlhausler The Ecolinguistics Reader Language Ecology and Environment 2001
100% (2)
Alwin Fill Peter Muhlhausler The Ecolinguistics Reader Language Ecology and Environment 2001
305 pages
Mörk Borg - Mörk Borg Cult - Feretory
77% (39)
Mörk Borg - Mörk Borg Cult - Feretory
68 pages
Wolff AC, Et Al. Arch Pathol Lab Med. 2023
No ratings yet
Wolff AC, Et Al. Arch Pathol Lab Med. 2023
8 pages
PC Product Catalogue - AP (2014) PDF
No ratings yet
PC Product Catalogue - AP (2014) PDF
33 pages
B.Ed Psychology Unit 2
No ratings yet
B.Ed Psychology Unit 2
17 pages
Challenging Racism & Sexism - Alternatives To Genetic Explanations :: Review
No ratings yet
Challenging Racism & Sexism - Alternatives To Genetic Explanations :: Review
4 pages
Protein Assay Using The Bradford Method
100% (3)
Protein Assay Using The Bradford Method
2 pages
Case Study Strep
No ratings yet
Case Study Strep
10 pages
Reproduction in Animals CLASS VIII NOTES
No ratings yet
Reproduction in Animals CLASS VIII NOTES
7 pages
Forensic Science UGC NET Examination Question Paper 2 2018 July
No ratings yet
Forensic Science UGC NET Examination Question Paper 2 2018 July
40 pages
Blast
100% (1)
Blast
21 pages
Dispersal's Role in Life History Evolution
No ratings yet
Dispersal's Role in Life History Evolution
9 pages
Appendix 2 HC Series Urine Reagent Strips Instructions V1.02
No ratings yet
Appendix 2 HC Series Urine Reagent Strips Instructions V1.02
2 pages

Data Mining Methods

Uploaded by

Data Mining Methods

Uploaded by

Introduction to

Data Mining Methods

Ø Anomaly/outlier 260 Unusual Time

• Differ from the “norm” 240

• E.g., fraud 200

• E.g., extreme events 180

Ø Closed pattern X: no super-pattern Y ⊃ X

You might also like