Big Data Syllabus

The document outlines a curriculum for a 45-hour course on Big Data, covering five units: Introduction to Big Data, MapReduce Development & Hive/Pig, Apache Spark for Batch & Real-Time Processing, NoSQL, Kafka & Real-Time Analytics, and Visualization, Optimization & Cloud Deployment. Each unit includes specific topics such as Hadoop architecture, MapReduce pipeline, Spark cluster architecture, NoSQL database models, and data visualization approaches. The course aims to provide a comprehensive understanding of Big Data technologies and their applications.

Uploaded by

Vaibhav Srivastav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views1 page

Big Data Syllabus

Uploaded by

Vaibhav Srivastav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 1

UNIT TITLE HOURS

I Introduction to Big Data 9

Introduction to Big Data, Big Data characteristics, Challenges of Conventional System, Types of Big Data,
Intelligent data analysis, Traditional vs. Big Data business approach, Case Study of Big Data Solutions,
Hadoop architecture: HDFS, Namenode/Datanode, block replication, Setting up and configuring HDFS in
standalone/pseudo-distributed mode, HDFS commands and data ingestion best practices, Hadoop
ecosystem: YARN, MapReduce framework overview, Data ingestion patterns: Sqoop for RDBMS, Flume
for streaming
UNIT TITLE HOURS
II MapReduce Development & Hive/Pig 9
MapReduce pipeline: Mapper, MapReduce pipeline: Mapper, Reducer, Combiner, Partitioner
Reducer, Combiner, Partitioner,
Data formats: Writables, Data formats: Writables, SequenceFile, Avro, Parquet
SequenceFile, Avro, Parquet, Hive
architecture, HiveQL: table Hive architecture, HiveQL: table creation, partitions, UDFs
creation, partitions, UDFs, Pig
Latin: scripting, data flow
Pig Latin: scripting, data flow operators, performance
operators, performance
considerations considerations

UNIT TITLE HOURS

III Apache Spark for Batch & Real-Time Processing 9
Spark cluster architecture: driver, executors, master, RDD vs DataFrame vs Dataset abstractions, Spark
SQL and DataFrame transformations & actions, Spark Streaming: micro-batch processing, MLlib
introduction: basic ML pipelines
UNIT TITLE HOURS
IV NoSQL, Kafka & Real-Time Analytics 9
NoSQL database models: key-value, document, column-family, graph, Cassandra data modelling and
architecture, MongoDB CRUD operations and indexing strategies, Kafka architecture: producers,
consumers, partitions, Integration of Kafka‐Spark for real-time processing
UNIT TITLE HOURS
V Visualization, Optimization & Cloud Deployment 9
Data visualization approaches using Zeppelin, Jupyter, or Grafana, Spark optimization: shuffles, caching,
partitioning strategies, Hadoop & Spark deployment models: standalone, YARN, Mesos, Kubernetes,
Integration with cloud services: AWS EMR, Azure HDInsight, End-to-end workflow orchestration using
Oozie or Airflow
TOTAL HOURS : 45

Big Data-2
No ratings yet
Big Data-2
3 pages
Specialised Programme On Big Data and Machine Learning - 8 Weeks
No ratings yet
Specialised Programme On Big Data and Machine Learning - 8 Weeks
6 pages
GAME
No ratings yet
GAME
2 pages
BCA - 409 Syallabus
No ratings yet
BCA - 409 Syallabus
2 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
BDA Syllabus
No ratings yet
BDA Syllabus
4 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Big Data Processing for Students
No ratings yet
Big Data Processing for Students
2 pages
Big Data With Hadoop and Spark - 2023-25
No ratings yet
Big Data With Hadoop and Spark - 2023-25
4 pages
Syllabus
No ratings yet
Syllabus
7 pages
Big Data Syllabus For Theory and Lab
No ratings yet
Big Data Syllabus For Theory and Lab
4 pages
B.tech.-CSE - IBM 2023-24 Syllabus.
No ratings yet
B.tech.-CSE - IBM 2023-24 Syllabus.
1 page
Course Outline Big Data Analytics
No ratings yet
Course Outline Big Data Analytics
2 pages
Annexure - I - Syllabus PG-DBDA Aug 16
No ratings yet
Annexure - I - Syllabus PG-DBDA Aug 16
4 pages
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
No ratings yet
BE AIDS R 20 VII VIII Sem Syllabus - Compressed
55 pages
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
No ratings yet
B.Tech. CS - CE and CSE Syllabus 3rd Year 2024-25
2 pages
SYLLABUS
No ratings yet
SYLLABUS
2 pages
BD Course Handout
No ratings yet
BD Course Handout
5 pages
Ibd Syllabus and Model Paper - Template
No ratings yet
Ibd Syllabus and Model Paper - Template
6 pages
CC ZG522 Course Handout
No ratings yet
CC ZG522 Course Handout
6 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
CIT 4401big Data Analytics Course Outline
No ratings yet
CIT 4401big Data Analytics Course Outline
5 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
Big Data Framework
No ratings yet
Big Data Framework
3 pages
2024 25 ODD CE449 BDA Syllabus
No ratings yet
2024 25 ODD CE449 BDA Syllabus
4 pages
Big Data Analytics Course Outline (Fall 2020) : Dr. Tariq Mahmood 830 Am - 11 Am (Monday) Scope
No ratings yet
Big Data Analytics Course Outline (Fall 2020) : Dr. Tariq Mahmood 830 Am - 11 Am (Monday) Scope
3 pages
Syllabus
No ratings yet
Syllabus
3 pages
COMP9313: Big Data Management
No ratings yet
COMP9313: Big Data Management
79 pages
113 Ce 74
No ratings yet
113 Ce 74
4 pages
Final Lesson Plan
No ratings yet
Final Lesson Plan
8 pages
Big Data Technologies Course Outline
No ratings yet
Big Data Technologies Course Outline
2 pages
Koe097big Data
No ratings yet
Koe097big Data
1 page
iitG-Big Data (Old Syllabus)
No ratings yet
iitG-Big Data (Old Syllabus)
2 pages
Bigdata Syllabus
No ratings yet
Bigdata Syllabus
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
4.7.1 Bda-Mba
No ratings yet
4.7.1 Bda-Mba
2 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
R-20 4-1 Syllabus
No ratings yet
R-20 4-1 Syllabus
34 pages
CS8091 Bigdata Analytics Lessonplan With Date
No ratings yet
CS8091 Bigdata Analytics Lessonplan With Date
11 pages
Question Bank Big Data Analytics
No ratings yet
Question Bank Big Data Analytics
2 pages
BDA Syllabus
No ratings yet
BDA Syllabus
3 pages
Data Science C
No ratings yet
Data Science C
21 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
Information Technology Engineering Syllabus Sem Viii Mumbai University
No ratings yet
Information Technology Engineering Syllabus Sem Viii Mumbai University
60 pages
Old M.tech BDA Curriculum
No ratings yet
Old M.tech BDA Curriculum
32 pages
BD Course Handout (Spring 2024)
No ratings yet
BD Course Handout (Spring 2024)
4 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
22IS61 Big Data Analytics 2025
No ratings yet
22IS61 Big Data Analytics 2025
4 pages
Big Data - Hadoop & Spark Training Syllabus: Tamilboomi
No ratings yet
Big Data - Hadoop & Spark Training Syllabus: Tamilboomi
4 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
10bda Lesson Plan 24-25
No ratings yet
10bda Lesson Plan 24-25
3 pages
Big Data Analytics Comp Syllabus Sem7
No ratings yet
Big Data Analytics Comp Syllabus Sem7
4 pages
V Sem AIML
No ratings yet
V Sem AIML
12 pages
Using Elevate Web Builder
100% (1)
Using Elevate Web Builder
240 pages
Rohit Ranan CV Updated
No ratings yet
Rohit Ranan CV Updated
3 pages
Java Notes Unit 5
No ratings yet
Java Notes Unit 5
9 pages
Question Bank CSF101-PPS
No ratings yet
Question Bank CSF101-PPS
4 pages
Image Project Document
No ratings yet
Image Project Document
15 pages
Finalterm Examination CS101-Introduction To Computing
No ratings yet
Finalterm Examination CS101-Introduction To Computing
8 pages
Specification: (6) (B) C Program To Input Two Matrices, Check The Compatibility and Perform Addition and
No ratings yet
Specification: (6) (B) C Program To Input Two Matrices, Check The Compatibility and Perform Addition and
8 pages
Retail Inventory System Guide
No ratings yet
Retail Inventory System Guide
20 pages
Answers To Testing Throughout The Software Life Cycle Section
No ratings yet
Answers To Testing Throughout The Software Life Cycle Section
4 pages
Breadcrumbs
No ratings yet
Breadcrumbs
3 pages
Introduction To OData Services
No ratings yet
Introduction To OData Services
76 pages
Apcs Lab03
No ratings yet
Apcs Lab03
5 pages
Imba Strategy Complite
No ratings yet
Imba Strategy Complite
20 pages
OS Synchronization with Monitors
No ratings yet
OS Synchronization with Monitors
21 pages
Python: A Industrial Training and Project Presentation
No ratings yet
Python: A Industrial Training and Project Presentation
11 pages
Userload HTML
No ratings yet
Userload HTML
17 pages
Variablename: Int Float
No ratings yet
Variablename: Int Float
5 pages
PIC 16f877a Bit Control Instructions
No ratings yet
PIC 16f877a Bit Control Instructions
14 pages
Chapter 5
No ratings yet
Chapter 5
43 pages
Travel Companion Finder System
No ratings yet
Travel Companion Finder System
13 pages
Sql4sap 2019
No ratings yet
Sql4sap 2019
16 pages
10.PEGA Scenario Based Question, Lock Mechanism, All Obj Methods
No ratings yet
10.PEGA Scenario Based Question, Lock Mechanism, All Obj Methods
61 pages
Angular JS
No ratings yet
Angular JS
14 pages
D2T3 - James Forshaw - Introduction To Logical Privilege Escalation On Windows
No ratings yet
D2T3 - James Forshaw - Introduction To Logical Privilege Escalation On Windows
116 pages
Spreadsheet Audit Work Program - 0
No ratings yet
Spreadsheet Audit Work Program - 0
16 pages
Beginning JSON 1st Edition Ben Smith Instant Download
No ratings yet
Beginning JSON 1st Edition Ben Smith Instant Download
60 pages
CodeBase User Guide
No ratings yet
CodeBase User Guide
134 pages
Online Shopping
No ratings yet
Online Shopping
4 pages
Engineering Placement Insights
No ratings yet
Engineering Placement Insights
65 pages
AWS Devops Engineer
No ratings yet
AWS Devops Engineer
13 pages

Big Data Syllabus

Uploaded by

Big Data Syllabus

Uploaded by

UNIT TITLE HOURS

I Introduction to Big Data 9

UNIT TITLE HOURS

You might also like