0% found this document useful (0 votes)

391 views4 pages

Foundation of Data Science Syllabus

Uploaded by

Deepika Kamboj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

391 views4 pages

Foundation of Data Science Syllabus

Uploaded by

Deepika Kamboj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Course Code Course name L T P C

Foundation of Data Science 3 0 1

Total Units to be Covered: 5 Total Contact Hours:
Prerequisite:- Python Programming Syllabus version: 1.0

Course Objectives
1. To explore the different concepts of Statistics.
2. To acquire a basic understanding of the Machine learning Models.
3. To comprehend software requirements for implementing statistical and ML
models.

Course Outcomes

CO1. Understand the fundamentals of Data Science.

CO2. Acquire the concepts and tools of data integration and data processing.
CO3. Explore software for data integration and data preprocessing.
CO4. To learn how to apply statistical & ML methods for predictive modelling.
CO5. To develop skills for effective data visualization.

CO-PO Mapping

Program
Outcomes
Course PO1 PO2 PO3 PO4 PO5 PO6 PO7 PO8 PO9 PO10 PO11 PO12 PSO1 PSO2 PSO3
Outcomes

CO 1 2 3 2 2 1 - - - 2 - 3 - 1 2 -
CO 2 2 3 2 2 1 - - - 2 - 3 - 1 2 -
CO 3 2 3 2 3 1 - - - 2 - 3 - 1 2 -
CO 4 2 3 2 3 1 - - - 2 - 3 - 1 2 -
- - - - - -
Average
2 3 2 2.5 1 2 3 1 2

1 – Weakly Mapped (Low) 2 – Moderately Mapped (Medium)

3 – Strongly Mapped (High) “_” means there is no correlation

Syllabus

Unit I: Introduction to Data Science

7 Lecture Hours

Evolution of Data Science, Data Science Roles, Stages in a Data Science Project,
Applications of Data Science in various fields, Data Security Issues, Mathematical
Foundations for Data Science, Exploratory Data Analysis, Data Munging or Data
Wrangling, Theory of causation, The Difference Between Business Analytics (BI),
Data Analytics and Data Science

Unit II: Data Collection and Data Pre-Processing

7 Lecture Hours

Data Collection Strategies, Data Pre-Processing Overview, Data Cleaning, Data

Integration and Transformation, Data Reduction, Data Discretization, Binary
Encoding, One-Hot Encoding, Standardization, Normalization; Data Bases; SQL
Tables; Functions, Pandas. Data Types and Formats (Structured, Unstructured, Semi-
Structured), Data Collection Methods (APIs, Web Scraping, Databases)
.
Unit III: Exploratory Data Analytics & Descriptive Statistics

11 Lecture Hours

Introduction to exploratory data analytics & Descriptive Statistics (Mean, Standard

Deviation), Skewness and Kurtosis (Box Plots, Pivot Table, Heat Map, Correlation
Statistics), Basic Probability Concepts, Conditional Probability and Bayes' Theorem,
Probability Distributions (Binomial, Poisson, Normal). Inferential Statistics- (Sampling
Methods, Central Limit Theorem, Confidence Intervals), Hypothesis Testing (Null and
Alternative Hypotheses, Type I and Type II Errors, t-tests, Chi-Square Tests, ANOVA),
Regression Analysis (Simple Linear Regression, Multiple Linear Regression,
Assumptions of Regression Analysis, Model Evaluation Metrics (R², Adjusted R²,
RMSE))
Unit IV: Model Development (Classification & Clustering Methods)

13 Lecture Hours

Simple and Multiple Regression, Supervised vs. Unsupervised Learning, Key

Algorithms (Linear Regression, Decision Trees, K-Means), Classification Algorithms
(K-Nearest Neighbors, Support Vector Machines, etc), Clustering Techniques (K-
Means, Hierarchical Clustering, DBSCAN, etc), Dimensionality Reduction (Principal
Component Analysis), Anomaly Detection, Feature Selection and Extraction, Handling
Categorical and Numerical Data, Model Selection and Hyperparameter Tuning Model
Evaluation (Confusion Matrix, ROC Curve, AUC, Cross-Validation, Metrics) – Model
Evaluation using Visualization – Residual Plot – Distribution Plot – Polynomial
Regression and Pipelines – Measures for In-sample Evaluation – Prediction and
Decision Making,

Unit V: Big Data and Cloud Computing

7 Lecture Hours

Introduction to Big Data Technologies (Hadoop, Spark), Definition and Characteristics

of Big Data (Volume, Variety, Velocity, Veracity), Big Data vs. Traditional Data,
Overview of Big Data Technologies and Ecosystem, Big Data Storage and Processing
Frameworks, Distributed Systems and Parallel Computing, Overview of Hadoop
Ecosystem (HDFS, YARN, MapReduce), Introduction to Apache Spark Use Cases
and Applications of Big Data, Data Storage and Management (NoSQL), Relational vs.
NoSQL Databases, Types of NoSQL Databases: Key-Value, Document, Column-
Family, Graph, CAP Theorem and BASE Properties, NoSQL Use Cases and
Advantages

Cloud Platforms for Data Science (AWS, Google Cloud, Azure), Definition and History
of Cloud Computing, Benefits and Challenges of Cloud Computing, Key Concepts:
Scalability, Elasticity, Agility, Cloud Service Models (IaaS, PaaS, SaaS), Overview of
Amazon Web Services (AWS), Overview of Microsoft Azure, Overview of Google
Cloud Platform (GCP), Comparison of Cloud Providers

Total lecture Hours 45

Textbooks
1. Peter Bruce, Andrew Bruce, Peter Gedeck, Practical Statistics for Data Scientists,
2e: 50+ Essential Concepts Using R and Python June 2020, O′Reilly

2. Balamurugan Balusamy, Nandhini Abirami R et.el, " Big Data: Concepts,

Technology, and Architecture, June 2021, Wiley

3. Derrick Rountree, Ileana Castrillo (“The Basics of Cloud Computing:

Understanding the Fundamentals of Cloud Computing in Theory and Practice”
November 2013, Syngress

Reference Books
1. Aurélien Géron , " Hands-On Machine Learning with Scikit-Learn, Keras, and
TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, Third
Edition, 2022, O′Reilly

2. Funmi Obembe, Ofer Engel, " A Hands-on Introduction to Big Data Analytics ",
February 2024 | SAGE Publications Ltd.

Modes of Evaluation: Quiz/Assignment/ presentation/ extempore/ Written

Examination
Examination Scheme
Components IA MID SEM End Sem Total
Weightage (%) 50 20 30 100

Detailed breakup of Internal Assessment

Internal Assessment Weightage in calculation of Internal
Component Assessment (100 marks)
Quiz 1 15%
Quiz 2 15%
Class Test 1 15%
Class Test 2 15%
Assignment 1/Project 20%
Assignment 2/Project 20%

Data Science
No ratings yet
Data Science
9 pages
Data Science - Syllabus
No ratings yet
Data Science - Syllabus
14 pages
Ocs353dsf Unit Wise Notes
100% (2)
Ocs353dsf Unit Wise Notes
121 pages
Data Science & Python Syllabus 2022-24
No ratings yet
Data Science & Python Syllabus 2022-24
9 pages
Data Science Syllabus
No ratings yet
Data Science Syllabus
3 pages
Syllabus Fundamentals of Data Science
No ratings yet
Syllabus Fundamentals of Data Science
7 pages
DAI101 Detailed Syllabus
No ratings yet
DAI101 Detailed Syllabus
1 page
Data Science Syl Lab Us
No ratings yet
Data Science Syl Lab Us
4 pages
Cds3005 Foundations-Of-data-science LP 1.0 18 Cds3005 Foundation-Of-data-science LP 1.0 1 Foundations of Data Science
No ratings yet
Cds3005 Foundations-Of-data-science LP 1.0 18 Cds3005 Foundation-Of-data-science LP 1.0 1 Foundations of Data Science
2 pages
Course Outline PDF
No ratings yet
Course Outline PDF
2 pages
CS5103 Lecture Plan - Fundamnetals of Data Science
No ratings yet
CS5103 Lecture Plan - Fundamnetals of Data Science
2 pages
Fundementalsof Data Science
No ratings yet
Fundementalsof Data Science
4 pages
BE Elex and Comp Engg - 2019 Course
No ratings yet
BE Elex and Comp Engg - 2019 Course
91 pages
Data Science Syllabus
No ratings yet
Data Science Syllabus
3 pages
Intro To Data-Science Final
No ratings yet
Intro To Data-Science Final
3 pages
Sem 6
No ratings yet
Sem 6
12 pages
303 - Data Analysis Using Python
No ratings yet
303 - Data Analysis Using Python
6 pages
310251: Data Science and Big Data Analytics
No ratings yet
310251: Data Science and Big Data Analytics
2 pages
Edit Ds
No ratings yet
Edit Ds
37 pages
M.Tech Data Science Weekend Syllabus
No ratings yet
M.Tech Data Science Weekend Syllabus
18 pages
TE Computer 2019 Course 22.06.2021-52-99
No ratings yet
TE Computer 2019 Course 22.06.2021-52-99
48 pages
Ocs353 Data Science Fundamentals
No ratings yet
Ocs353 Data Science Fundamentals
2 pages
Syllabus FDS
No ratings yet
Syllabus FDS
4 pages
Cab112:Introduction To Data Science: Session 2024-25 Page:1/2
No ratings yet
Cab112:Introduction To Data Science: Session 2024-25 Page:1/2
2 pages
Data Science and Machine Learning Syllabus V1.0
No ratings yet
Data Science and Machine Learning Syllabus V1.0
6 pages
Dsbda Syllabus
No ratings yet
Dsbda Syllabus
3 pages
DSP U1
No ratings yet
DSP U1
89 pages
Ya5uE5 Syllabus Instructors
No ratings yet
Ya5uE5 Syllabus Instructors
2 pages
Syllabus - PGD - DS - Batch-7 PDF
No ratings yet
Syllabus - PGD - DS - Batch-7 PDF
12 pages
U23AD492 - Data Science Syllabus
No ratings yet
U23AD492 - Data Science Syllabus
4 pages
SYCS Minor Syllabus
No ratings yet
SYCS Minor Syllabus
12 pages
Data Science Honor Syllabus Sem-I
No ratings yet
Data Science Honor Syllabus Sem-I
5 pages
DSP U2
No ratings yet
DSP U2
172 pages
Hammad Raza.
No ratings yet
Hammad Raza.
28 pages
CS 3352 Foundations of Data Science Syllabus
No ratings yet
CS 3352 Foundations of Data Science Syllabus
2 pages
DataScience Minordegree 2023 Syllabus
No ratings yet
DataScience Minordegree 2023 Syllabus
12 pages
20ad41e2 - Data Science
No ratings yet
20ad41e2 - Data Science
2 pages
DSF Notes
No ratings yet
DSF Notes
97 pages
Old M.tech BDA Curriculum
No ratings yet
Old M.tech BDA Curriculum
32 pages
Syllabus Sem 7
No ratings yet
Syllabus Sem 7
10 pages
Perform Association Mining and Analyze Clusters Using Different Methods
No ratings yet
Perform Association Mining and Analyze Clusters Using Different Methods
90 pages
Ids Unit 1,2,3,4 & 5
No ratings yet
Ids Unit 1,2,3,4 & 5
117 pages
2nd - Semester - Data Science - Final - Updated
No ratings yet
2nd - Semester - Data Science - Final - Updated
15 pages
21CSS303T Data Science Syllabus
No ratings yet
21CSS303T Data Science Syllabus
2 pages
Introduction To Data Science Course Outline
No ratings yet
Introduction To Data Science Course Outline
5 pages
SEM 4 Stuff
No ratings yet
SEM 4 Stuff
27 pages
B.Tech CSE 8th Sem
No ratings yet
B.Tech CSE 8th Sem
10 pages
r21 III II Syllabus Hits-1
No ratings yet
r21 III II Syllabus Hits-1
26 pages
2nd - Semester - Data Science
No ratings yet
2nd - Semester - Data Science
16 pages
Data Science and Analytics
No ratings yet
Data Science and Analytics
3 pages
Data Warehousing & Mining Course
No ratings yet
Data Warehousing & Mining Course
45 pages
Foundations of Data Science
No ratings yet
Foundations of Data Science
3 pages
Course Curriculum
No ratings yet
Course Curriculum
3 pages
MDU B.Tech CSE 8th Sem Syllabus
No ratings yet
MDU B.Tech CSE 8th Sem Syllabus
7 pages
MSc Big Data Analytics Syllabus
No ratings yet
MSc Big Data Analytics Syllabus
40 pages
Question Paper DSBDA
No ratings yet
Question Paper DSBDA
16 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
59 pages
JNVU IT Engineering Class List 2017
No ratings yet
JNVU IT Engineering Class List 2017
1 page
B.E. IT 2017-18 Syllabus & Exam Scheme
No ratings yet
B.E. IT 2017-18 Syllabus & Exam Scheme
33 pages
Loops PDF
No ratings yet
Loops PDF
37 pages
Loops PDF
No ratings yet
Loops PDF
37 pages
IP Addressing
No ratings yet
IP Addressing
18 pages
JavaBean and BDK PDF
No ratings yet
JavaBean and BDK PDF
6 pages
Quantitative Research Essentials
No ratings yet
Quantitative Research Essentials
13 pages
NCLEX Nurses
No ratings yet
NCLEX Nurses
5 pages
ANSWERS To Epidemiology Assignment
No ratings yet
ANSWERS To Epidemiology Assignment
7 pages
Thesis
No ratings yet
Thesis
31 pages
Gbs10e PPT ch09
No ratings yet
Gbs10e PPT ch09
47 pages
Regression in Geoda: Briggs Henan University 2010 1
No ratings yet
Regression in Geoda: Briggs Henan University 2010 1
37 pages
Green Credit Boosts ESG in China
No ratings yet
Green Credit Boosts ESG in China
7 pages
An Empirical Study of The Geospatial Availability of Hospitals in Imo East Using GPS Mapping
No ratings yet
An Empirical Study of The Geospatial Availability of Hospitals in Imo East Using GPS Mapping
8 pages
Machine Learning Quiz for Students
No ratings yet
Machine Learning Quiz for Students
8 pages
Application of Statistics in Real Life: By: Shrestha Pranay and Shivam Surya Nirwana
No ratings yet
Application of Statistics in Real Life: By: Shrestha Pranay and Shivam Surya Nirwana
21 pages
Bivariate Linear Regression
No ratings yet
Bivariate Linear Regression
33 pages
Lesson 15 - Crossover Designs
No ratings yet
Lesson 15 - Crossover Designs
20 pages
Hypothesis Testing Lesson Plan
75% (4)
Hypothesis Testing Lesson Plan
5 pages
Amazon Career Choice - Data Analytics Syll - Desconocido
No ratings yet
Amazon Career Choice - Data Analytics Syll - Desconocido
10 pages
0826 Statistics (Class Notes) (Vanessa 2022)
No ratings yet
0826 Statistics (Class Notes) (Vanessa 2022)
43 pages
Understanding Data Types in Statistics
No ratings yet
Understanding Data Types in Statistics
15 pages
COVID-19 Anxiety in Manila BPO Workers
No ratings yet
COVID-19 Anxiety in Manila BPO Workers
36 pages
Student-Centered Learning Impact
No ratings yet
Student-Centered Learning Impact
33 pages
Lampiran Tabel 1. Uji Wilcoxon A. Ranks
No ratings yet
Lampiran Tabel 1. Uji Wilcoxon A. Ranks
13 pages
Solution Manual For Business Analytics, 4th Edition, Jeffrey D. Camm, James J. Cochran, Michael J. Fry, Jeffrey W. Ohlmann PDF Download
100% (1)
Solution Manual For Business Analytics, 4th Edition, Jeffrey D. Camm, James J. Cochran, Michael J. Fry, Jeffrey W. Ohlmann PDF Download
76 pages
UGJ - RAHMADI Flash Sale To Keputusan Inter
No ratings yet
UGJ - RAHMADI Flash Sale To Keputusan Inter
14 pages
9780133354690
No ratings yet
9780133354690
3 pages
The Elements of Stochastic Processes - With Applications To The Natural Sciences Norman T J
100% (1)
The Elements of Stochastic Processes - With Applications To The Natural Sciences Norman T J
130 pages
Ethiopian Stats Exit Exam Guide
100% (2)
Ethiopian Stats Exit Exam Guide
9 pages
Efs Group 1-1
No ratings yet
Efs Group 1-1
14 pages
Decision Theory
No ratings yet
Decision Theory
5 pages
2013 Arifin Introductiontosamplesizecalculation
No ratings yet
2013 Arifin Introductiontosamplesizecalculation
9 pages
Students Anxiety in Speaking English in Public
100% (1)
Students Anxiety in Speaking English in Public
14 pages
Completed Staff Work Training Guide
No ratings yet
Completed Staff Work Training Guide
53 pages

Foundation of Data Science Syllabus

Uploaded by

Foundation of Data Science Syllabus

Uploaded by

Course Code Course name L T P C

Foundation of Data Science 3 0 1

CO1. Understand the fundamentals of Data Science.

1 – Weakly Mapped (Low) 2 – Moderately Mapped (Medium)

3 – Strongly Mapped (High) “_” means there is no correlation

Unit I: Introduction to Data Science

Unit II: Data Collection and Data Pre-Processing

Data Collection Strategies, Data Pre-Processing Overview, Data Cleaning, Data

Introduction to exploratory data analytics & Descriptive Statistics (Mean, Standard

Simple and Multiple Regression, Supervised vs. Unsupervised Learning, Key

Unit V: Big Data and Cloud Computing

Introduction to Big Data Technologies (Hadoop, Spark), Definition and Characteristics

Total lecture Hours 45

2. Balamurugan Balusamy, Nandhini Abirami R et.el, " Big Data: Concepts,

3. Derrick Rountree, Ileana Castrillo (“The Basics of Cloud Computing:

Modes of Evaluation: Quiz/Assignment/ presentation/ extempore/ Written

Detailed breakup of Internal Assessment

You might also like