Streaming Data

The document discusses data stream processing architectures, specifically Lambda, Kappa, and Delta architectures. Lambda architecture separates batch and real-time processing into three layers, while Kappa simplifies this by using a single stream processing pipeline for both. The choice of architecture depends on the specific needs of the application, considering factors like complexity and performance.

Uploaded by

Muneeba Kaleem

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

34 views33 pages

Streaming Data

Uploaded by

Muneeba Kaleem

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 33

•

•
Data Stream Data Stream
Sales Sales
Trends Distribution

Data-Driven Marketing
Monitoring and Fault
Detection
~60M Flight
Events
Weekly!
Data Stream
Data Stream

A possibly unbounded sequence

of data records
Data Stream

A possibly unbounded sequence

of data records
Timestamped Geo-tagged
Data Stream
Streaming Data
System
Data Streams
Results
Streaming Data
System
Data Streams
Manage one record or Results
small time window
Streaming Data
System
Data Streams
Manage one record or Results
small time window
Near-real-time
Streaming Data
System
Data Streams
Manage one record or Results
small time window
Near-real-time
Independent
computations
Streaming Data
System
Data Streams
Manage one record or Results
small time window
Near-real-time
Independent
computations
Non-interactive
•

•
•
•
•
•

•
Static / Batch
Size determines
Processing
time and space

Streaming Unbounded size,

Processing but finite time
and space
•

•
λ Now

Batch Real-time
Batch Real-time
Batch Real-time
…
Time
The Lambda architecture is structured into three layers:

1. Batch Layer:
• Responsible for managing the historical data and processing it in
batches.
• Performs complex algorithms on the entire data set to provide
comprehensive and accurate results.
• Output is stored in a batch view, which is a read-optimized view of the
data.
2. Speed Layer:
• Handles real-time data processing.
• Provides low-latency results for recent data.
• Output from the speed layer is combined with the batch layer's results
to generate a complete and up-to-date view of the data.
3. Serving Layer:
• Serves the results to queries in real-time.
• Merges the results from the batch and speed layers to provide a unified
view.

Kappa Architecture
In contrast to the Lambda architecture, which maintains separate batch and stream
processing paths, the Kappa architecture proposes using a single stream processing
pipeline for both real-time and batch data. The key idea is to treat batch processing
as a special case of stream processing.

Here are the main components of the Kappa architecture:

1. Stream Ingestion:
• All data, whether historical or real-time, is ingested through a unified
stream processing pipeline.
2. Stream Processing:
• A stream processing engine processes the data in real-time as it arrives.
• The same processing logic is applied to both historical and real-time
data.
3. Storage:
•Processed data is stored in a storage system that is optimized for
efficient querying and retrieval.
4. Query Layer:
• The query layer interacts with the storage system to serve queries and
provide access to the processed data.

While the Kappa architecture offers simplicity and elegance, it may not be suitable
for all use cases. For example, if batch processing requires complex algorithms or if
there is a need for explicit separation of concerns between batch and real-time
processing, the Lambda architecture or a hybrid approach might be more
appropriate.

Ultimately, the choice between the Kappa and Lambda architectures depends on the
specific requirements of a given big data application and the trade-offs that the
architecture introduces in terms of complexity, maintainability, and performance.

Delta Architecture
Size

Frequency
Periodic: evenings,
weekends, etc.

Sporadic: major
events
Average
= 6000
Tweets / Second

Record
> 144,000
Tweets / Second
•
•
•
Manage one record or
small time window Many challenges!
Near-real-time
Independent
computations
Non-interactive

Bigdata Unit-Ii
No ratings yet
Bigdata Unit-Ii
33 pages
Chapter 1-1
No ratings yet
Chapter 1-1
34 pages
Mining Data Streams in Data Analytics Refers To The Process of Extracting Useful Patterns
No ratings yet
Mining Data Streams in Data Analytics Refers To The Process of Extracting Useful Patterns
30 pages
Data Analytics Unit 3
No ratings yet
Data Analytics Unit 3
14 pages
4 Building Blocks of A Streaming Data Architecture
No ratings yet
4 Building Blocks of A Streaming Data Architecture
11 pages
BDA Unit-4
No ratings yet
BDA Unit-4
12 pages
DataStreaming L-4
No ratings yet
DataStreaming L-4
16 pages
Chapter 1
No ratings yet
Chapter 1
13 pages
5 Unit
No ratings yet
5 Unit
5 pages
Stream Processing
No ratings yet
Stream Processing
33 pages
BDA Unit 3
No ratings yet
BDA Unit 3
18 pages
Stream Processing for IT/CSE Students
No ratings yet
Stream Processing for IT/CSE Students
57 pages
Unit 3-6
No ratings yet
Unit 3-6
14 pages
JyothsnaDST Unit-1 Extra
No ratings yet
JyothsnaDST Unit-1 Extra
25 pages
BDA Lec10
No ratings yet
BDA Lec10
33 pages
Big Data 3rd Assignment Answers
No ratings yet
Big Data 3rd Assignment Answers
8 pages
Data Stream in Data Analytics
No ratings yet
Data Stream in Data Analytics
4 pages
Chapter 6
No ratings yet
Chapter 6
26 pages
Big Data Stream Processing Guide
No ratings yet
Big Data Stream Processing Guide
22 pages
Unit 2
No ratings yet
Unit 2
10 pages
Unit-2 BDA
No ratings yet
Unit-2 BDA
30 pages
6 - Streaming Part 1
No ratings yet
6 - Streaming Part 1
44 pages
DBT Unit 4 Slides
No ratings yet
DBT Unit 4 Slides
286 pages
Big Data Analytics - Unit 2 Notes
No ratings yet
Big Data Analytics - Unit 2 Notes
44 pages
StreamProcessingAndAnalytics Handout
No ratings yet
StreamProcessingAndAnalytics Handout
7 pages
Unit4 2
No ratings yet
Unit4 2
40 pages
TRabl StreamProcessing
No ratings yet
TRabl StreamProcessing
79 pages
Big Data Analytics Module 4 Mumbai University
No ratings yet
Big Data Analytics Module 4 Mumbai University
24 pages
Stream Processing for Engineers
No ratings yet
Stream Processing for Engineers
152 pages
UNIT-2 (Big Data)
No ratings yet
UNIT-2 (Big Data)
30 pages
Bda Mid Ans
No ratings yet
Bda Mid Ans
18 pages
Module-2-MINING DATA STREAMS
100% (3)
Module-2-MINING DATA STREAMS
17 pages
Lec 01
No ratings yet
Lec 01
17 pages
Lecture #7.1 - Introducing Streaming Data
No ratings yet
Lecture #7.1 - Introducing Streaming Data
24 pages
Unit-Ii 30-1-24
No ratings yet
Unit-Ii 30-1-24
162 pages
Data Stream Mining Essentials
No ratings yet
Data Stream Mining Essentials
33 pages
What Is Stream Processing
No ratings yet
What Is Stream Processing
3 pages
014 - Distinguishing Features of Streaming Data
No ratings yet
014 - Distinguishing Features of Streaming Data
2 pages
Streaming Data Insights for Tech Pros
No ratings yet
Streaming Data Insights for Tech Pros
4 pages
Unit 3
No ratings yet
Unit 3
30 pages
Real-Time Streaming in Big Data: Kafka and Spark With Singlestore
100% (1)
Real-Time Streaming in Big Data: Kafka and Spark With Singlestore
23 pages
Stream Computing
No ratings yet
Stream Computing
18 pages
Real-Time Data Stream Applications
No ratings yet
Real-Time Data Stream Applications
18 pages
Lec 19
No ratings yet
Lec 19
24 pages
Kafka
No ratings yet
Kafka
21 pages
Unit Iv
No ratings yet
Unit Iv
5 pages
Unit Iv
No ratings yet
Unit Iv
11 pages
BDA Mod 3
No ratings yet
BDA Mod 3
57 pages
SPA Session 10 Stream Platforms
No ratings yet
SPA Session 10 Stream Platforms
26 pages
Big Data Notes
No ratings yet
Big Data Notes
37 pages
Bigdata-Mining Data Streams
No ratings yet
Bigdata-Mining Data Streams
19 pages
SA Unit 1 PPT 5
No ratings yet
SA Unit 1 PPT 5
14 pages
Stream Processing With: Tamás István Ujj
No ratings yet
Stream Processing With: Tamás István Ujj
27 pages
Swe2011 Bda - III
No ratings yet
Swe2011 Bda - III
53 pages
Stream Processing in Big Data
No ratings yet
Stream Processing in Big Data
39 pages
Streaming Graph Processing Unit5
No ratings yet
Streaming Graph Processing Unit5
7 pages
Module3A MiningBigDataStreams
No ratings yet
Module3A MiningBigDataStreams
145 pages
5071918
No ratings yet
5071918
12 pages
Day-4 Deep Learning and Machine Learning
No ratings yet
Day-4 Deep Learning and Machine Learning
11 pages
KNN Datacamp
No ratings yet
KNN Datacamp
31 pages
Ned University of Engineering & Technology: SPRING SEMESTER EXAMINATIONS 2025 (Postgraduate)
No ratings yet
Ned University of Engineering & Technology: SPRING SEMESTER EXAMINATIONS 2025 (Postgraduate)
1 page
Clustering Kmeans
No ratings yet
Clustering Kmeans
6 pages
Bigquery
No ratings yet
Bigquery
25 pages
Callback and Promise
No ratings yet
Callback and Promise
2 pages
Add Patient Use Case Document
No ratings yet
Add Patient Use Case Document
10 pages
Ambulance Dispatch System Test Plan
No ratings yet
Ambulance Dispatch System Test Plan
22 pages
SRS Master Login Module
No ratings yet
SRS Master Login Module
17 pages
API Specification Doc: (Online Hotel Mangement App)
No ratings yet
API Specification Doc: (Online Hotel Mangement App)
7 pages
2 Node Modules
No ratings yet
2 Node Modules
5 pages
101 Lab Sheet-3 1
No ratings yet
101 Lab Sheet-3 1
8 pages
Moisture Content Determination
No ratings yet
Moisture Content Determination
5 pages
Greengrass v2 Developer Guide
No ratings yet
Greengrass v2 Developer Guide
947 pages
Sorghum Disease Detection with AI
No ratings yet
Sorghum Disease Detection with AI
29 pages
Statistics Summer Course
No ratings yet
Statistics Summer Course
49 pages
Importing Data Python Cheat Sheet PDF
No ratings yet
Importing Data Python Cheat Sheet PDF
1 page
Pendulum Energy Program Engineering
100% (2)
Pendulum Energy Program Engineering
86 pages
Agilent Technologies E7475A GSM Drive-Test System: Product Overview
No ratings yet
Agilent Technologies E7475A GSM Drive-Test System: Product Overview
16 pages
3.16 Swiveling - CYCLE800 (SW 6.2 and Later)
No ratings yet
3.16 Swiveling - CYCLE800 (SW 6.2 and Later)
32 pages
Statistics: Rejection Regions Guide
67% (3)
Statistics: Rejection Regions Guide
12 pages
Winters Promise Quilt Pattern
No ratings yet
Winters Promise Quilt Pattern
7 pages
SEIKO 6M13 Watch User Guide
100% (1)
SEIKO 6M13 Watch User Guide
20 pages
Hospital Management Software Development: Olawale Ayotunde Sobogungod
No ratings yet
Hospital Management Software Development: Olawale Ayotunde Sobogungod
3 pages
Muller Lyer Illusion
No ratings yet
Muller Lyer Illusion
8 pages
Stairs: A Little Bit About Them: Slope
No ratings yet
Stairs: A Little Bit About Them: Slope
2 pages
U1L07 - Activity Guide - Apps With Storage
No ratings yet
U1L07 - Activity Guide - Apps With Storage
2 pages
BMW's Decade in F1: Engine Evolution
100% (1)
BMW's Decade in F1: Engine Evolution
17 pages
Cryptography & Network Security
No ratings yet
Cryptography & Network Security
10 pages
Dice Maiden: TRPG Dice Rolling Bot Guide
No ratings yet
Dice Maiden: TRPG Dice Rolling Bot Guide
3 pages
5GNR With IBflex - v1
No ratings yet
5GNR With IBflex - v1
4 pages
Indian Journal Subscription Details
No ratings yet
Indian Journal Subscription Details
16 pages
BBACA 2019 Pat. SEM III CA 302 Data Structure MCQ
No ratings yet
BBACA 2019 Pat. SEM III CA 302 Data Structure MCQ
22 pages
Vehicle Technology: Curtis Instruments, Inc
No ratings yet
Vehicle Technology: Curtis Instruments, Inc
11 pages
Review ICC
No ratings yet
Review ICC
3 pages
Marine Fuel Oil Insights
No ratings yet
Marine Fuel Oil Insights
118 pages
Essar 32
No ratings yet
Essar 32
2 pages
UMTS RF Troubleshooting Guide
100% (1)
UMTS RF Troubleshooting Guide
111 pages
Deep Learning Exam Guide
No ratings yet
Deep Learning Exam Guide
3 pages
Pma - ks98 2 2 Us 1802 - Dat
No ratings yet
Pma - ks98 2 2 Us 1802 - Dat
10 pages
Friction
No ratings yet
Friction
31 pages

Streaming Data

Uploaded by

Streaming Data

Uploaded by

•

A possibly unbounded sequence

A possibly unbounded sequence

Streaming Unbounded size,

Here are the main components of the Kappa architecture:

You might also like