0% found this document useful (0 votes)

601 views4 pages

Rule-Based Classification Guide

Rule-based classification uses if-then rules to classify data. Rules have an antecedent (if) part and consequent (then) part. Sequential covering algorithms extract rules directly from training data by sequentially learning rules for each class that cover many examples of that class. The quality of rules is assessed based on both coverage of examples and accuracy of classification. Pruning may be applied to simplify rules while maintaining good performance.

Uploaded by

Raj Endran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

601 views4 pages

Rule-Based Classification Guide

Uploaded by

Raj Endran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

RULE BASED CLASSIFICATION

Rule-Based Classification
Model Rules
Set of IF-THEN rules
IF age = youth AND student = yes THEN
buys_computer = yes
Rule antecedent/precondition vs. rule consequent
Assessment of a rule: coverage and accuracy
ncovers = # of tuples covered by R
ncorrect = # of tuples correctly classified by R
coverage(R) = ncovers /|D| /* D: training data set
*/
accuracy(R) = ncorrect / ncovers
Rule Accuracy and Coverage
If-Then Rules
Rule Triggering
Input X satisfies a rule
Several rules are triggered Conflict Resolution
Size Ordering

Highest priority to toughest (rule antecedent

size) rule
Rule Ordering

Rules are prioritized before-hand

Class based ordering

Rules for most prevalent class comes first
or based on mis-classification cost / class

Rule-based ordering
Rule Quality based measures
Ordered list Decision list Must be
processed strictly in order
No rule is triggered Default rule

Rule Extraction from a Decision Tree

Example: Rule extraction from the buys_computer

decision-tree
IF age = young AND student = no THEN
buys_computer = no
IF age = young AND student = yes THEN
buys_computer = yes
IF age = mid-age THEN buys_computer = yes
IF age = old AND credit_rating = excellent THEN
buys_computer = yes
IF age = young AND credit_rating = fair THEN
buys_computer = no
Set of extracted rules very high
Pruning may be required
Rule Generalization For a given rule
antecedent any condition that does not improve
the estimated accuracy can be dropped
Side-effects of pruning

Mutually Exclusive? / Exhaustive?

C4.5 Class Ordering for Conflict resolution

All rules for a single class are grouped

together

Class rule sets are ranked to minimize falsepositive errors

Default class one that contains most training

tuples not covered by any rule
Rule Extraction from the Training Data

Sequential covering algorithm: Extracts rules

directly from training data
Associative Classification Algorithms may also

be used

Typical sequential covering algorithms: FOIL (First

Order Inductive Learner), AQ, CN2, RIPPER

Rules are learned sequentially, each rule for a given
class Ci will cover many tuples of Ci but none (or
few) of the tuples of other classes
Steps:

Rules are learned one at a time

Each time a rule is learned, the tuples covered by

the rules are removed

The process repeats on the remaining tuples

unless termination condition, e.g., when no more
training examples or when the quality of a rule
returned is below a user-specified threshold
Algorithm: Sequential Covering
Input: D, Att_vals
Output: If-Then rules
Method:
Rule_set = {}
For each class c do
Repeat
Rule = Learn_One_Rule(D, Att_vals, c) //
Finds best rule for given class
Remove tuples covered by Rule from D
Until terminating condition
Rule_set = Rule_set + Rule
End for
Return Rule_Set

Start with the most general rule possible: condition =

empty
Adding new attributes by adopting a greedy depthfirst strategy
Picks the one that most improves the rule quality

Example:
Start with IF _ THEN loan_decision = accept
Consider IF loan_term=short THEN.. / IF
loan_term=long THEN.. / IF income = high
THEN.. / IF income = medium THEN.. /
If best one is IF income = high THEN
loan_decision = accept expand it further

Rule Quality measures

Coverage or Accuracy independently will not be
sufficient
Rule-Quality measures: consider both coverage and
accuracy
Foil-gain (in FOIL & RIPPER): assesses
info_gain by extending condition

It favors rules that have high accuracy and cover

many positive tuples
R Existing rule; R Extended rule
Likelihood Ratio Statistic
m
Likelihood_Ratio = 2 i=1
fi log(fi/ei)
Greater this value higher the significance
Rule pruning based on an independent set of test
tuples
Pos/neg are # of positive/negative tuples covered
by R.
If FOIL_Prune is higher for the pruned version of
R, prune R

DBMS Tree Indexes Explained
No ratings yet
DBMS Tree Indexes Explained
65 pages
Academic Database Design & SQL Queries
No ratings yet
Academic Database Design & SQL Queries
5 pages
Mining Graphs
No ratings yet
Mining Graphs
23 pages
Unit of Analysis
No ratings yet
Unit of Analysis
56 pages
DBMS Answer Key
100% (1)
DBMS Answer Key
26 pages
Unit-3 DWDM
No ratings yet
Unit-3 DWDM
11 pages
Chpater 1 - Unit 2
No ratings yet
Chpater 1 - Unit 2
31 pages
Introduction To Pig: SESSION 2016-2017
No ratings yet
Introduction To Pig: SESSION 2016-2017
44 pages
Database Lab: DDL & Constraints
No ratings yet
Database Lab: DDL & Constraints
7 pages
DWM Manual
No ratings yet
DWM Manual
60 pages
Unit 4
No ratings yet
Unit 4
4 pages
HTML Advantage and Disadvantage
No ratings yet
HTML Advantage and Disadvantage
4 pages
DataWarehouseMining Complete Notes
No ratings yet
DataWarehouseMining Complete Notes
55 pages
Dbms Lab Manual
No ratings yet
Dbms Lab Manual
19 pages
KPMG Recent Power BI Interview Q&A
100% (1)
KPMG Recent Power BI Interview Q&A
5 pages
Query Processing Questions and Explanation
No ratings yet
Query Processing Questions and Explanation
8 pages
Database Lab for CSE Students
No ratings yet
Database Lab for CSE Students
3 pages
ASP.NET State Management Guide
No ratings yet
ASP.NET State Management Guide
6 pages
Reporting and Query Tools and Applications: Tool Categories
No ratings yet
Reporting and Query Tools and Applications: Tool Categories
13 pages
Database and DBMS: A Comprehensive Guide
No ratings yet
Database and DBMS: A Comprehensive Guide
32 pages
University Database E-R Diagram
No ratings yet
University Database E-R Diagram
5 pages
3.4 Lda
No ratings yet
3.4 Lda
12 pages
Object-Relational & NoSQL Databases
No ratings yet
Object-Relational & NoSQL Databases
46 pages
Algorithms and Data Structures: Dynamic Programming Matrix-Chain Multiplication
No ratings yet
Algorithms and Data Structures: Dynamic Programming Matrix-Chain Multiplication
17 pages
Applications of Data Structures
No ratings yet
Applications of Data Structures
6 pages
Artificial Intelligence: Chapter 6: Representing Knowledge Using Rules
No ratings yet
Artificial Intelligence: Chapter 6: Representing Knowledge Using Rules
54 pages
ML Lab Programs (1-12)
No ratings yet
ML Lab Programs (1-12)
35 pages
Techniques To Evaluate Accuracy of Classifier in Data Mining
No ratings yet
Techniques To Evaluate Accuracy of Classifier in Data Mining
2 pages
Adsa Lab Manual
No ratings yet
Adsa Lab Manual
52 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
Database Normalization Guide
No ratings yet
Database Normalization Guide
31 pages
JNDI Java Application Guide
No ratings yet
JNDI Java Application Guide
14 pages
(Placement Management Sysem) : Project Report
50% (2)
(Placement Management Sysem) : Project Report
24 pages
F U-4 PDF
No ratings yet
F U-4 PDF
48 pages
Practical No.2 Perform The Extraction Transformation and Loading (ETL) Process To Construct The Database in The Sqlserver
No ratings yet
Practical No.2 Perform The Extraction Transformation and Loading (ETL) Process To Construct The Database in The Sqlserver
12 pages
ADS & A Unit-5 Study Material
No ratings yet
ADS & A Unit-5 Study Material
50 pages
AI and Expert Systems Overview
100% (1)
AI and Expert Systems Overview
18 pages
UE20CS332 Unit2 Slides PDF
No ratings yet
UE20CS332 Unit2 Slides PDF
264 pages
JUnit Lab Manual - Quick Guide
No ratings yet
JUnit Lab Manual - Quick Guide
64 pages
Data Discretization Techniques
No ratings yet
Data Discretization Techniques
21 pages
ADBMS-UNIT-3 - Functional Dependency
No ratings yet
ADBMS-UNIT-3 - Functional Dependency
9 pages
Naive Bayes
No ratings yet
Naive Bayes
11 pages
Unit 3 - Basic Search and Traversal Techniques
100% (2)
Unit 3 - Basic Search and Traversal Techniques
113 pages
Dbms PPT For Chapter 7
No ratings yet
Dbms PPT For Chapter 7
45 pages
ML Unit 3
No ratings yet
ML Unit 3
30 pages
06 Feature Engineering
No ratings yet
06 Feature Engineering
24 pages
Java Course Content Updated - WinPath IT
No ratings yet
Java Course Content Updated - WinPath IT
5 pages
Unit - Iii RDBMS Notes
No ratings yet
Unit - Iii RDBMS Notes
26 pages
Data Mining and Model Selection
No ratings yet
Data Mining and Model Selection
27 pages
Data Warehouse Schemas For Decision Support
No ratings yet
Data Warehouse Schemas For Decision Support
13 pages
DAA 3rd Unit Notes
No ratings yet
DAA 3rd Unit Notes
25 pages
SQL Basics for Beginners
No ratings yet
SQL Basics for Beginners
82 pages
Data Mining Concept Description: Characterization and Comparison
No ratings yet
Data Mining Concept Description: Characterization and Comparison
14 pages
Normalization
No ratings yet
Normalization
14 pages
5.1 Mining Data Streams
No ratings yet
5.1 Mining Data Streams
16 pages
Combined CD Ac Papers
No ratings yet
Combined CD Ac Papers
466 pages
Dbms Aicte Lab
No ratings yet
Dbms Aicte Lab
42 pages
IME672 - Lecture 48
No ratings yet
IME672 - Lecture 48
21 pages
Lecture 9
No ratings yet
Lecture 9
32 pages
Unit6 - 5 Rule Based Classifier
No ratings yet
Unit6 - 5 Rule Based Classifier
28 pages
Data Mining-Graph Mining
No ratings yet
Data Mining-Graph Mining
9 pages
Data Mining-Mining Sequence Patterns in Biological Data
No ratings yet
Data Mining-Mining Sequence Patterns in Biological Data
6 pages
Data Mining-Mining Time Series Data
0% (1)
Data Mining-Mining Time Series Data
7 pages
Data Mining - Mining Sequential Patterns
No ratings yet
Data Mining - Mining Sequential Patterns
10 pages
Data Mining-Multimedia Datamining
No ratings yet
Data Mining-Multimedia Datamining
8 pages
Data Mining-Backpropagation
100% (1)
Data Mining-Backpropagation
5 pages
Spatial Data Mining Techniques
No ratings yet
Spatial Data Mining Techniques
8 pages
Data Mining-Outlier Analysis
No ratings yet
Data Mining-Outlier Analysis
6 pages
Data Mining-Constraint Based Cluster Analysis
100% (1)
Data Mining-Constraint Based Cluster Analysis
4 pages
Data Mining - Data Reduction
No ratings yet
Data Mining - Data Reduction
6 pages
Data Mining-Model Based Clustering
No ratings yet
Data Mining-Model Based Clustering
8 pages
Data Mining-Partitioning Methods
100% (1)
Data Mining-Partitioning Methods
7 pages
Data Science: Classification & Regression
No ratings yet
Data Science: Classification & Regression
7 pages
Data Warehouse Concepts & Models
No ratings yet
Data Warehouse Concepts & Models
7 pages
Data Mining-Applications, Issues
No ratings yet
Data Mining-Applications, Issues
9 pages
Bayesian Classification Guide
No ratings yet
Bayesian Classification Guide
6 pages
Data Mining - Discretization
100% (1)
Data Mining - Discretization
5 pages
Data Mining - Outlier Analysis
100% (3)
Data Mining - Outlier Analysis
11 pages
Data Mining - Density Based Clustering
No ratings yet
Data Mining - Density Based Clustering
8 pages
02 Data Mining-Partitioning Method
No ratings yet
02 Data Mining-Partitioning Method
8 pages
08 Data Mining-Other Classifications
No ratings yet
08 Data Mining-Other Classifications
4 pages
Physics 211 Lab 1
No ratings yet
Physics 211 Lab 1
2 pages
Quality Control
No ratings yet
Quality Control
19 pages
Nelson 2015 Scientific Basis For Polygraph
No ratings yet
Nelson 2015 Scientific Basis For Polygraph
34 pages
Basic EMP Study Report Example Ouput Description
No ratings yet
Basic EMP Study Report Example Ouput Description
5 pages
Bituminous Mixtures - Test Methods For Hot Mix Asphalt - : Part 25: Cyclic Compression Test
No ratings yet
Bituminous Mixtures - Test Methods For Hot Mix Asphalt - : Part 25: Cyclic Compression Test
32 pages
Measurement & Instrumentation Course
No ratings yet
Measurement & Instrumentation Course
8 pages
Baul Machines Brochure EN
No ratings yet
Baul Machines Brochure EN
20 pages
LevelMe-DataSheet ENG 130702
No ratings yet
LevelMe-DataSheet ENG 130702
2 pages
The Use of Texture For Image Classification of Bla
No ratings yet
The Use of Texture For Image Classification of Bla
11 pages
Rar Practicals Bokok
No ratings yet
Rar Practicals Bokok
14 pages
Functionality Considerations in Custom SCADA Development Tools
No ratings yet
Functionality Considerations in Custom SCADA Development Tools
5 pages
Hydraulic Bursting Strength of Textile Fabrics-Diaphragm Bursting Strength Tester Method
No ratings yet
Hydraulic Bursting Strength of Textile Fabrics-Diaphragm Bursting Strength Tester Method
4 pages
12350-8-2010 Fresh Concrete
100% (2)
12350-8-2010 Fresh Concrete
14 pages
Solution MQC
No ratings yet
Solution MQC
16 pages
Designing Unit Test Cases PDF
No ratings yet
Designing Unit Test Cases PDF
15 pages
GM 000 Mnl-U01-En
No ratings yet
GM 000 Mnl-U01-En
25 pages
YoloV8 Classification Model
No ratings yet
YoloV8 Classification Model
6 pages
LE Kumar Project Paper 3
No ratings yet
LE Kumar Project Paper 3
7 pages
Dinh Can OiML 76
No ratings yet
Dinh Can OiML 76
7 pages
AP Chemistry Day 1 Review Guide
No ratings yet
AP Chemistry Day 1 Review Guide
7 pages
Cambridge International A Level: Mathematics 9709/31 October/November 2022
No ratings yet
Cambridge International A Level: Mathematics 9709/31 October/November 2022
17 pages
Schut Mikrometry
No ratings yet
Schut Mikrometry
115 pages
Pharmaceutical Calculations L4 Part II
No ratings yet
Pharmaceutical Calculations L4 Part II
7 pages
AEMA FinalRegBroch
No ratings yet
AEMA FinalRegBroch
37 pages
Hoklas SC-38
No ratings yet
Hoklas SC-38
16 pages
Ore Dilution and Quality-Control
No ratings yet
Ore Dilution and Quality-Control
24 pages
G563e Part 3 DCS800-Winder WINDER - PHYSICS - 01R0201
100% (1)
G563e Part 3 DCS800-Winder WINDER - PHYSICS - 01R0201
27 pages
LMV1000 Precision Machine Inspection
No ratings yet
LMV1000 Precision Machine Inspection
8 pages
Ti-Pure Color Measurement Method
No ratings yet
Ti-Pure Color Measurement Method
11 pages
Form 4 (Daily Lesson Plan)
No ratings yet
Form 4 (Daily Lesson Plan)
39 pages

Rule-Based Classification Guide

Uploaded by

Rule-Based Classification Guide

Uploaded by

RULE BASED CLASSIFICATION

Highest priority to toughest (rule antecedent

Rules are prioritized before-hand

Class based ordering

Rule Extraction from a Decision Tree

Example: Rule extraction from the buys_computer

Mutually Exclusive? / Exhaustive?

All rules for a single class are grouped

Class rule sets are ranked to minimize falsepositive errors

Default class one that contains most training

Sequential covering algorithm: Extracts rules

Typical sequential covering algorithms: FOIL (First

Order Inductive Learner), AQ, CN2, RIPPER

Rules are learned one at a time

Each time a rule is learned, the tuples covered by

The process repeats on the remaining tuples

Start with the most general rule possible: condition =

Rule Quality measures

It favors rules that have high accuracy and cover

You might also like