Basic Statistics

Uploaded by

saumya srivastava

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

103 views2 pages

Basic Statistics

Uploaded by

saumya srivastava

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

BASIC STATISTICS

Descriptive Analytics and Data Preprocessing on Sales &

Discounts Dataset

Introduction
● To perform descriptive analytics, visualize data distributions, and preprocess
the dataset for further analysis.

Descriptive Analytics for Numerical Columns

● Objective: To compute and analyze basic statistical measures for numerical
columns in the dataset.
● Steps:
Load the dataset into a data analysis tool or programming environment
(e.g., Python with pandas library).
Identify numerical columns in the dataset.
Calculate the mean, median, mode, and standard deviation for these
columns.
Provide a brief interpretation of these statistics.

Data Visualization
● Objective: To visualize the distribution and relationship of numerical and
categorical variables in the dataset.
● Histograms:
Plot histograms for each numerical column.
Analyze the distribution (e.g., skewness, presence of outliers) and provide
inferences.
● Boxplots:
Create boxplots for numerical variables to identify outliers and the
interquartile range.
Discuss any findings, such as extreme values or unusual distributions.
● Bar Chart Analysis for Categorical Column:
Identify categorical columns in the dataset.
Create bar charts to visualize the frequency or count of each category.
Analyze the distribution of categories and provide insights.

Standardization of Numerical Variables

● Objective: To scale numerical variables for uniformity, improving the dataset’s
suitability for analytical models.
● Steps:
Explain the concept of standardization (z-score normalization).
Standardize the numerical columns using the formula: z=x-mu/sigma

Show before and after comparisons of the data distributions.

Conversion of Categorical Data into Dummy Variables

● Objective: To transform categorical variables into a format that can be
provided to ML algorithms.
● Steps:
Discuss the need for converting categorical data into dummy variables
(one-hot encoding).
Apply one-hot encoding to the categorical columns, creating binary (0 or
1) columns for each category.
Display a portion of the transformed dataset.

Conclusion
● Summarize the key findings from the descriptive analytics and data
visualizations.
● Reflect on the importance of data preprocessing steps like standardization
and one-hot encoding in data analysis and machine learning.

ML Report
No ratings yet
ML Report
12 pages
Descriptive Analytics
No ratings yet
Descriptive Analytics
4 pages
Data Basics For ML
No ratings yet
Data Basics For ML
23 pages
DS Day 5
No ratings yet
DS Day 5
11 pages
Deneesha Tharunika Sooriyaarachchi CL-HDCSE-CMU-102-40 CSE5014 1668472 412159309
No ratings yet
Deneesha Tharunika Sooriyaarachchi CL-HDCSE-CMU-102-40 CSE5014 1668472 412159309
15 pages
Ad3301 Apr May 2024 Answer Key
No ratings yet
Ad3301 Apr May 2024 Answer Key
31 pages
FINAL LECTURE 3,4.pptx - AutoRecovered (Autosaved)
No ratings yet
FINAL LECTURE 3,4.pptx - AutoRecovered (Autosaved)
80 pages
FINAL LECTURE 3,4.pptx - AutoRecovered
No ratings yet
FINAL LECTURE 3,4.pptx - AutoRecovered
73 pages
Data Visualization
No ratings yet
Data Visualization
18 pages
Amit Khilare Used Device Data PM Project
No ratings yet
Amit Khilare Used Device Data PM Project
25 pages
Week - 1 Day - 1 Descriptive Statistics
No ratings yet
Week - 1 Day - 1 Descriptive Statistics
40 pages
Analytical Decision Making
No ratings yet
Analytical Decision Making
27 pages
Aa MDM MST
No ratings yet
Aa MDM MST
8 pages
Dsa Report
No ratings yet
Dsa Report
11 pages
Ia - Eda
No ratings yet
Ia - Eda
10 pages
Detailed Data Analytics Notes
No ratings yet
Detailed Data Analytics Notes
3 pages
Unit2 Modified
No ratings yet
Unit2 Modified
42 pages
Practical No.-01
No ratings yet
Practical No.-01
25 pages
Data Analytics Types & Tools Guide
No ratings yet
Data Analytics Types & Tools Guide
3 pages
Data Preprocessing & Analysis Guide
No ratings yet
Data Preprocessing & Analysis Guide
11 pages
DVA Unit 1 - Part 2
No ratings yet
DVA Unit 1 - Part 2
53 pages
Da Laqs Saqs
No ratings yet
Da Laqs Saqs
23 pages
Chapt-3 Data Visualization
No ratings yet
Chapt-3 Data Visualization
73 pages
DS Mini
No ratings yet
DS Mini
3 pages
DAI101 4 Data Preparation
No ratings yet
DAI101 4 Data Preparation
45 pages
OMG355 Multivariate Data Analysis Full Book PDF
No ratings yet
OMG355 Multivariate Data Analysis Full Book PDF
113 pages
The Machine Learning Process Involves Several Steps That Help Develop and Deploy A Successful Machine Learning Model
No ratings yet
The Machine Learning Process Involves Several Steps That Help Develop and Deploy A Successful Machine Learning Model
62 pages
Week13 2 Data Analysis 2
No ratings yet
Week13 2 Data Analysis 2
44 pages
Business Analytics (MIS171) Summary Notes
No ratings yet
Business Analytics (MIS171) Summary Notes
6 pages
Jahnavijillella ML1 30 06 2024 PDF
No ratings yet
Jahnavijillella ML1 30 06 2024 PDF
53 pages
Cami16 Data Analytics
No ratings yet
Cami16 Data Analytics
37 pages
02 Exploratory Data Analytics
No ratings yet
02 Exploratory Data Analytics
41 pages
Prac 2
No ratings yet
Prac 2
11 pages
FDS - 3 Solved
No ratings yet
FDS - 3 Solved
21 pages
Comprehensive Guide to Data Analytics
No ratings yet
Comprehensive Guide to Data Analytics
4 pages
All Analysiscode Explanation
No ratings yet
All Analysiscode Explanation
22 pages
Data Analytics Notes
No ratings yet
Data Analytics Notes
2 pages
Its665 Report
No ratings yet
Its665 Report
45 pages
Prac 2
No ratings yet
Prac 2
11 pages
Quantitative Methods 3
No ratings yet
Quantitative Methods 3
174 pages
QM 1
No ratings yet
QM 1
58 pages
FDS Pyq2
No ratings yet
FDS Pyq2
10 pages
Data Analytics Notes
No ratings yet
Data Analytics Notes
18 pages
FDS - 2 Solved
No ratings yet
FDS - 2 Solved
14 pages
DAC Phase2
No ratings yet
DAC Phase2
8 pages
Data Transformation
No ratings yet
Data Transformation
5 pages
Machine Learning: Technical Requirements & Data Processing Guide
No ratings yet
Machine Learning: Technical Requirements & Data Processing Guide
30 pages
AD3301 Data Exploration and Visualization
No ratings yet
AD3301 Data Exploration and Visualization
278 pages
Week 2 - 3getting To Know Your Data
No ratings yet
Week 2 - 3getting To Know Your Data
67 pages
Ds 5
No ratings yet
Ds 5
9 pages
Data Analysis Guide for Beginners
No ratings yet
Data Analysis Guide for Beginners
26 pages
Big Data Analytics Assignment - 1
No ratings yet
Big Data Analytics Assignment - 1
14 pages
Data Mining Report
No ratings yet
Data Mining Report
5 pages
CS202 Assignment - 4 - GIKI
No ratings yet
CS202 Assignment - 4 - GIKI
3 pages
Presentation
No ratings yet
Presentation
19 pages
Unit 1
No ratings yet
Unit 1
36 pages
Da Unit 1
No ratings yet
Da Unit 1
12 pages
Chapter 2descriptive Statistics and PCA
No ratings yet
Chapter 2descriptive Statistics and PCA
26 pages
Data Visualization and Summarization
No ratings yet
Data Visualization and Summarization
7 pages
C995 18 PDF
No ratings yet
C995 18 PDF
14 pages
HR Analytics of GREEN DESTINATIONS
No ratings yet
HR Analytics of GREEN DESTINATIONS
38 pages
Discovering Anomalous Aviation Safety Events Using Scalable Data Mining Algorithms
No ratings yet
Discovering Anomalous Aviation Safety Events Using Scalable Data Mining Algorithms
12 pages
Unit 1,2,3, And4
100% (1)
Unit 1,2,3, And4
159 pages
Li LEE ZHOU SUN 2011
No ratings yet
Li LEE ZHOU SUN 2011
9 pages
Applying Machine Learning To Improve Curriculum de
No ratings yet
Applying Machine Learning To Improve Curriculum de
8 pages
2022 Robustification of Shewhart Control Chart by Median
No ratings yet
2022 Robustification of Shewhart Control Chart by Median
14 pages
Prepare For The Unexpected: A Guide To Testing and Learning With Incrementality Measurement
No ratings yet
Prepare For The Unexpected: A Guide To Testing and Learning With Incrementality Measurement
16 pages
Concepts and Techniques: - Chapter 7
No ratings yet
Concepts and Techniques: - Chapter 7
70 pages
Apple & Kiwifruit Firmness Testing Study
No ratings yet
Apple & Kiwifruit Firmness Testing Study
10 pages
Concrete Setting Time by Penetration
No ratings yet
Concrete Setting Time by Penetration
7 pages
COTS Coffee Shop Strategic Analysis
No ratings yet
COTS Coffee Shop Strategic Analysis
14 pages
ACM Icmlt2022
No ratings yet
ACM Icmlt2022
13 pages
TOPNIR Technology Features and Advantages Rev3
No ratings yet
TOPNIR Technology Features and Advantages Rev3
7 pages
Real Estate Analysis Part I
No ratings yet
Real Estate Analysis Part I
8 pages
Triola Cap 1
No ratings yet
Triola Cap 1
27 pages
MQM100 MultipleChoice Chapter3
100% (2)
MQM100 MultipleChoice Chapter3
21 pages
Data Mining Nostos
No ratings yet
Data Mining Nostos
4 pages
Perrigo Consent Judgment
No ratings yet
Perrigo Consent Judgment
41 pages
Lecture 3 PDF
100% (2)
Lecture 3 PDF
77 pages
Statistics Project 1
No ratings yet
Statistics Project 1
14 pages
X X X X X X: Data Presentation and Interpretation
No ratings yet
X X X X X X: Data Presentation and Interpretation
89 pages
Data Preprocessing: Modern Data Analytics (G0Z39A) Prof. Dr. Ir. Jan de Spiegeleer
No ratings yet
Data Preprocessing: Modern Data Analytics (G0Z39A) Prof. Dr. Ir. Jan de Spiegeleer
82 pages
Interactive Effects Analysis of Road, Traffic, and Weather Characteristics On Shared E-Bike Speeding Risk - A Data-Driven Approach
No ratings yet
Interactive Effects Analysis of Road, Traffic, and Weather Characteristics On Shared E-Bike Speeding Risk - A Data-Driven Approach
18 pages
Webassign: Previous Answers
No ratings yet
Webassign: Previous Answers
10 pages
Data Screening (Sometimes Referred To As "Data Screaming") Is The Process of Ensuring Your Data Is
No ratings yet
Data Screening (Sometimes Referred To As "Data Screaming") Is The Process of Ensuring Your Data Is
4 pages
Data Cleansing Using R
0% (1)
Data Cleansing Using R
10 pages
Smart Water Metering Technology For Water Management in Urban Areas Analysing Water Consumption Patterns To Optimise Water Conservation
No ratings yet
Smart Water Metering Technology For Water Management in Urban Areas Analysing Water Consumption Patterns To Optimise Water Conservation
15 pages
Scatter Graphs
No ratings yet
Scatter Graphs
14 pages
Lab Data Analysis Guide
No ratings yet
Lab Data Analysis Guide
48 pages

Basic Statistics

Uploaded by

Basic Statistics

Uploaded by

BASIC STATISTICS

Descriptive Analytics and Data Preprocessing on Sales &

Descriptive Analytics for Numerical Columns

Standardization of Numerical Variables

Show before and after comparisons of the data distributions.

Conversion of Categorical Data into Dummy Variables

You might also like