0% found this document useful (0 votes)

49 views2 pages

Big Data Syllabus

CSR223 is an introductory course on Big Data, covering concepts such as the data life cycle, analytics methodologies, and statistical analysis. Students will learn data preparation, visualization techniques, and the use of various Big Data tools like Hadoop and MongoDB. The course includes practical experiments to reinforce theoretical knowledge and enhance hands-on skills in data manipulation and analysis.

Uploaded by

saiirctc786

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

49 views2 pages

Big Data Syllabus

Uploaded by

saiirctc786

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

CSR223:INTRODUCTION TO BIG DATA

L:2 T:0 P:2 Credits:3

Course Outcomes: Through this course students should be able to

CO1 :: demonstrate the different concepts of Big Data with Data life cycle.

CO2 :: apply basic strategies of the big data analytics and types of analytics.

CO3 :: infer the concept of statistical analysis.

CO4 :: evaluate the data preparation and modification task.

CO5 :: apply the data visualization and statistical analysis.

CO6 :: Explore the use of appropriate big data tools

Unit I
Overview of Big Data : introduction to big data, evolution of big data types and characteristics,
problem with traditional databases, basic architecture, application, advantages of big data processing,
data life cycle: business understanding, data understanding, data preparation, modelling, evaluation,
deployment
Unit II
Big Data analytics : methodology of big data analytics, introduction to data warehousing and data
mart, ETL and ELT, OLAP and OLTP, traditional analytics vs big data analytics, types of analytics
(prescriptive, predictive, descriptive) with examples, technologies for handling big data
Unit III
Introduction to statistical analysis : data modification: modifying data values, compute, selecting
cases, data and variables and their types, analysis and analytics, statistical analysis: introduction to
statistical analysis, levels of measurement, univariate, bivariate and multivariate analysis, parametric
and non-parametric tests
Unit IV
Data preparation and visualization : identifying duplicates and restructuring data, aggregating
data, merging files, basics of MS Excel software: removing duplicates, filtering, aggregation, pivoting
and visualization, data visualization: creating and editing charts (bar graph, pie chart, histogram, box
plot, scatter plot, line graph), crosstab, pivot table, outliers
Unit V
Introduction to Big Data tools : introduction to big data tools, hadoop distributed file system
(HDFS) architecture and operations, the MapReduce framework and its execution workflow, YARN for
resource management, Apache Hive for SQL-like querying, Apache Pig for data flow scripting, Apache
HBase as a column-oriented NoSQL database, integration of Hadoop with traditional databases and
data warehousing tools
Unit VI
Advanced Big Data tools and databases : brief introduction to Apache Spark, NoSQL databases:
MongoDB, Mongosh, Compass, configuration of Compass and Mongosh, CRUD Operations in MongoDB

List of Practicals / Experiments:

List of practicals
• Installation and configuration of Mongo DB and Mongosh

• Creation of database and Collection

• Implementation of CRUD operations

• Insert command and uploading multiple documents in MongoDB

• Performing Query operations (relation and logical operators) in Mongo DB

• Implementation of Update and Delete Document.

• Implementation of aggregation in Mogo DB

• Implementation of data preprocessing and modification

• Implementation of data visualization in python

Session 2024-25 Page:1/2

• Implementation of simple linear regression and Multiple Regression Analysis

References:
1. BIG DATA ANALYTICS by S CHANDRAMOULI ET AL, UNIVERSITIES PRESS PVT. LTD

2. SPSS STATISTICS FOR DATA ANALYSIS AND VISUALIZATION by KEITH MCCORMIK JESUS
SALCEDO, WILEY
3. BIG DATA ANALYTICS by VENKAT ANKAM, PACKT PUBLISHING

Session 2024-25 Page:2/2

Bigdata
No ratings yet
Bigdata
2 pages
BD Course Handout
No ratings yet
BD Course Handout
5 pages
CS8091 Bigdata QB 2022-2023 Final
No ratings yet
CS8091 Bigdata QB 2022-2023 Final
6 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Big Data
No ratings yet
Big Data
2 pages
BD Course Handout (Spring 2024)
No ratings yet
BD Course Handout (Spring 2024)
4 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Big Data - 2 Marks-1
No ratings yet
Big Data - 2 Marks-1
1 page
Big Data Analytics
No ratings yet
Big Data Analytics
131 pages
Course Outline PDF
No ratings yet
Course Outline PDF
4 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
22IS61 Big Data Analytics 2025
No ratings yet
22IS61 Big Data Analytics 2025
4 pages
BDA Syllabus
No ratings yet
BDA Syllabus
3 pages
CS8091 Bigdata Analytics Lessonplan With Date
No ratings yet
CS8091 Bigdata Analytics Lessonplan With Date
11 pages
BIG DATA ANALYTICS - Syllabus
No ratings yet
BIG DATA ANALYTICS - Syllabus
4 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
175 pages
CS8091 Syllabus
No ratings yet
CS8091 Syllabus
2 pages
CSE704 Data Analytics Syllabus Theory
No ratings yet
CSE704 Data Analytics Syllabus Theory
2 pages
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
No ratings yet
It - (R20) - 4-1 - Big Data Analytics - Digital Notes
117 pages
Ds603Pc: Big Data Analytics B.Tech. III Year II Sem. L T P C 3 0 0 3 Course Objectives
No ratings yet
Ds603Pc: Big Data Analytics B.Tech. III Year II Sem. L T P C 3 0 0 3 Course Objectives
1 page
COMP9313: Big Data Management
No ratings yet
COMP9313: Big Data Management
79 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
119 pages
113 Ce 74
No ratings yet
113 Ce 74
4 pages
2024 25 ODD CE449 BDA Syllabus
No ratings yet
2024 25 ODD CE449 BDA Syllabus
4 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
Cap456-Introduction To Big Data
No ratings yet
Cap456-Introduction To Big Data
1 page
Final Lesson Plan
No ratings yet
Final Lesson Plan
8 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
134 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
6th Sem - Big Data - IsE
No ratings yet
6th Sem - Big Data - IsE
5 pages
391 - CS8091 Big Data Analytics - Anna University 2017 Regulation Syllabus
0% (2)
391 - CS8091 Big Data Analytics - Anna University 2017 Regulation Syllabus
2 pages
HICET - Department of Computer Science and Engineering
No ratings yet
HICET - Department of Computer Science and Engineering
1 page
J. B. Institute of Engineering and Technology
No ratings yet
J. B. Institute of Engineering and Technology
1 page
Lesson Plan Big Data Analytics
No ratings yet
Lesson Plan Big Data Analytics
2 pages
Big Data & Hadoop Course Overview
50% (2)
Big Data & Hadoop Course Overview
3 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
CS8091 Big Data Analytics
No ratings yet
CS8091 Big Data Analytics
28 pages
IOT Analytics - AI361
No ratings yet
IOT Analytics - AI361
3 pages
Big Data Analytics (R20a0520)
No ratings yet
Big Data Analytics (R20a0520)
84 pages
Data Mining and Analytics
No ratings yet
Data Mining and Analytics
2 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
Big Data & Hadoop Course Overview
No ratings yet
Big Data & Hadoop Course Overview
3 pages
BDA Syllabus
No ratings yet
BDA Syllabus
2 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
19 pages
CIT 4401big Data Analytics Course Outline
No ratings yet
CIT 4401big Data Analytics Course Outline
5 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
Module 1 Introduction To Big Data Analytics
No ratings yet
Module 1 Introduction To Big Data Analytics
121 pages
College La Iruthu Come Back Bone Only For
No ratings yet
College La Iruthu Come Back Bone Only For
2 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Big Data Analytics
No ratings yet
Big Data Analytics
4 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
1 page
DLI Research Project Format
100% (1)
DLI Research Project Format
6 pages
BA Project Mirtunjay Singh
No ratings yet
BA Project Mirtunjay Singh
10 pages
BPCC 104 Full Textbook
No ratings yet
BPCC 104 Full Textbook
180 pages
Applied Longitudinal Data Analysis For Epidemiology A Practical Guide - 1st Edition ISBN 0521819768, 9780521819763 Full Download
No ratings yet
Applied Longitudinal Data Analysis For Epidemiology A Practical Guide - 1st Edition ISBN 0521819768, 9780521819763 Full Download
14 pages
AIML Simp Answers
No ratings yet
AIML Simp Answers
53 pages
Geostatistics for Reservoir Management
100% (2)
Geostatistics for Reservoir Management
74 pages
PredictiveAnalysis U1 U2
No ratings yet
PredictiveAnalysis U1 U2
7 pages
Employee Performance Analysis
No ratings yet
Employee Performance Analysis
3 pages
Unit 2 Describing Data
No ratings yet
Unit 2 Describing Data
21 pages
Import Seaborn As Sns
No ratings yet
Import Seaborn As Sns
27 pages
Customer Satisfaction Towards Online Shopping
No ratings yet
Customer Satisfaction Towards Online Shopping
67 pages
Exercise - Multivariate Analysis - Jupyter Notebook
No ratings yet
Exercise - Multivariate Analysis - Jupyter Notebook
14 pages
Univariate, Bivariate and Multivariate Statistics: Prof. Dr. Jimmy S. Luna, JD
100% (5)
Univariate, Bivariate and Multivariate Statistics: Prof. Dr. Jimmy S. Luna, JD
16 pages
Chapter 3 Organisation of Data
No ratings yet
Chapter 3 Organisation of Data
3 pages
QT Short Notes
No ratings yet
QT Short Notes
24 pages
Balaji Capstone Project 1
No ratings yet
Balaji Capstone Project 1
28 pages
(Ebook PDF) The Practice of Social Research 14th Edition PDF Download
100% (7)
(Ebook PDF) The Practice of Social Research 14th Edition PDF Download
57 pages
Personalized Mobile Technologies For Lifestyle Behavior Change
No ratings yet
Personalized Mobile Technologies For Lifestyle Behavior Change
12 pages
Intro to Descriptive Statistics
No ratings yet
Intro to Descriptive Statistics
5 pages
6) Exploratory Data Analysis
No ratings yet
6) Exploratory Data Analysis
29 pages
M3-M4-Understanding of Data
No ratings yet
M3-M4-Understanding of Data
16 pages
WST111 Study Guide 2024
No ratings yet
WST111 Study Guide 2024
30 pages
Define Statistics
No ratings yet
Define Statistics
6 pages
Test Bank for Managerial Statistics 9th Edition
No ratings yet
Test Bank for Managerial Statistics 9th Edition
12 pages
CS3361 Set1
No ratings yet
CS3361 Set1
5 pages
NCERT Solutions For Class 11 Economics Statistics Chapter 3 Organisation of Data
No ratings yet
NCERT Solutions For Class 11 Economics Statistics Chapter 3 Organisation of Data
9 pages
AGE 301 - NOTE - A-1
No ratings yet
AGE 301 - NOTE - A-1
8 pages
DTH Churn Prediction Analysis
No ratings yet
DTH Churn Prediction Analysis
31 pages
Univariate Bivariavte Multivariate
No ratings yet
Univariate Bivariavte Multivariate
10 pages
Jurnal
No ratings yet
Jurnal
10 pages

Big Data Syllabus

Uploaded by

Big Data Syllabus

Uploaded by

CSR223:INTRODUCTION TO BIG DATA

L:2 T:0 P:2 Credits:3

Course Outcomes: Through this course students should be able to

CO3 :: infer the concept of statistical analysis.

CO4 :: evaluate the data preparation and modification task.

CO5 :: apply the data visualization and statistical analysis.

CO6 :: Explore the use of appropriate big data tools

List of Practicals / Experiments:

• Creation of database and Collection

• Implementation of CRUD operations

• Insert command and uploading multiple documents in MongoDB

• Performing Query operations (relation and logical operators) in Mongo DB

• Implementation of Update and Delete Document.

• Implementation of aggregation in Mogo DB

• Implementation of data preprocessing and modification

• Implementation of data visualization in python

Session 2024-25 Page:1/2

Session 2024-25 Page:2/2

You might also like