Aws Data Engineering Project

Uploaded by

myr4112

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views1 page

Aws Data Engineering Project

Uploaded by

myr4112

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

■ AWS Data Engineering Project Roadmap

1. Core AWS Services (Must-Know for Data Engineers)

• Storage: Amazon S3 → Data Lake storage (raw, processed, curated zones).
• Compute: AWS EC2 (basic compute), AWS Lambda (serverless functions).
• Databases & Warehousing: Amazon RDS (Postgres/MySQL), Amazon Redshift (data
warehouse).
• ETL / Data Integration: AWS Glue (ETL with Python/Spark), Glue Data Catalog.
• Querying: Amazon Athena (SQL on S3).
• Streaming: Kinesis or MSK (Kafka).
• Workflow Orchestration: AWS Step Functions or Apache Airflow (MWAA).

2. Data Engineering Concepts You’ll Apply

• Data Lake Zones in S3: raw, staging, curated.
• ETL/ELT with Glue + Python/Spark.
• Partitioning and Bucketing for big data efficiency.
• Schema evolution and data cataloging.
• Batch vs. Streaming pipelines.

3. Step-by-Step Project Example (Batch Pipeline)

■ Project: E-commerce Sales Data Pipeline on AWS
• Ingest Data → Dump raw CSV/JSON files into S3.
• Catalog Data → Use Glue Crawler to create metadata tables.
• Transform Data (ETL) → Use Glue ETL job (Python/Spark) to clean and join data.
• Query Data → Use Athena (SQL) to query processed data in S3.
• Load to Warehouse → Move curated data to Redshift.
• Orchestrate Workflow → Automate using Step Functions or Airflow.
• Visualization → Connect Redshift/Athena to QuickSight or Power BI.

4. Intermediate Project (Streaming Pipeline)

• Stream clickstream/order events into Kinesis.
• Use Kinesis Data Firehose to land data in S3.
• Transform with Lambda or Glue Streaming Job.
• Query near-real time with Athena.

5. What to Learn Next (Priority Order)

• AWS S3 (data lake basics).
• AWS Glue (ETL with PySpark).
• AWS Athena (serverless querying).
• Amazon Redshift (warehousing).
• Orchestration (Step Functions or Airflow).
• Streaming (Kinesis).

Share
No ratings yet
Share
9 pages
Data Engineering Nanodegree Program Syllabus
No ratings yet
Data Engineering Nanodegree Program Syllabus
16 pages
Data Engineer Roadmap 2025
No ratings yet
Data Engineer Roadmap 2025
4 pages
Awsq
No ratings yet
Awsq
5 pages
AWS Data Engineering Guide
No ratings yet
AWS Data Engineering Guide
2 pages
AWS Data Lake
No ratings yet
AWS Data Lake
3 pages
TB-Data Engineering - Syllabus-2024
No ratings yet
TB-Data Engineering - Syllabus-2024
4 pages
AWS Tools for Data Engineers
No ratings yet
AWS Tools for Data Engineers
24 pages
AWS Learning Material
No ratings yet
AWS Learning Material
13 pages
AWS Syllabus
No ratings yet
AWS Syllabus
13 pages
RPSG (FMCG) - Datalake Technical Design Document
No ratings yet
RPSG (FMCG) - Datalake Technical Design Document
23 pages
5 AWS Data Engineering Projects
No ratings yet
5 AWS Data Engineering Projects
2 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
2 pages
AWS Data Engineering 1 Week Plan
No ratings yet
AWS Data Engineering 1 Week Plan
4 pages
A - Learning - Oreilly.com-Preface Data Engineering With AWS
No ratings yet
A - Learning - Oreilly.com-Preface Data Engineering With AWS
6 pages
Complete Data Engineering Roadmap With Resources
No ratings yet
Complete Data Engineering Roadmap With Resources
16 pages
AWS Data Lake
No ratings yet
AWS Data Lake
13 pages
PSO Data Analytics Day 1
100% (1)
PSO Data Analytics Day 1
106 pages
AWSCertified Data Engineer Associate TOC
No ratings yet
AWSCertified Data Engineer Associate TOC
3 pages
AWS ETL Pipeline for Data Engineers
No ratings yet
AWS ETL Pipeline for Data Engineers
4 pages
Data Engineering Strategy For ETL and AWS
No ratings yet
Data Engineering Strategy For ETL and AWS
3 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
3 pages
Data Engineering Roadmap Guide
No ratings yet
Data Engineering Roadmap Guide
3 pages
DocScanner 20 Oct 2024 2-19 PM
No ratings yet
DocScanner 20 Oct 2024 2-19 PM
16 pages
Data Engineering Report Final
No ratings yet
Data Engineering Report Final
56 pages
Data Engineering Notes Expanded
No ratings yet
Data Engineering Notes Expanded
2 pages
Architecture For Data Ingestion Clean Processing and Visulizationyounesse
No ratings yet
Architecture For Data Ingestion Clean Processing and Visulizationyounesse
2 pages
Modernserverlessdatalak
No ratings yet
Modernserverlessdatalak
45 pages
60-Day Data Lake Implementation Plan
No ratings yet
60-Day Data Lake Implementation Plan
4 pages
Data Engineering Roadmap Cloud
No ratings yet
Data Engineering Roadmap Cloud
2 pages
Aspiring Data Engineers Guide
No ratings yet
Aspiring Data Engineers Guide
1 page
Data Engineering Nanodegree Program Syllabus PDF
No ratings yet
Data Engineering Nanodegree Program Syllabus PDF
5 pages
AWS Walkthrough and Service Location Guide Rev
No ratings yet
AWS Walkthrough and Service Location Guide Rev
9 pages
Orchestrate Redshift ETL Using AWS Glue and Step Functions: You Will Learn
No ratings yet
Orchestrate Redshift ETL Using AWS Glue and Step Functions: You Will Learn
4 pages
Implementing Travel & Hospitality Data Mesh: AWS Reference Architecture
No ratings yet
Implementing Travel & Hospitality Data Mesh: AWS Reference Architecture
2 pages
AWS Data Lakes Course Overview
No ratings yet
AWS Data Lakes Course Overview
187 pages
Research - IBM DataStage To AWS Glue Migration
No ratings yet
Research - IBM DataStage To AWS Glue Migration
7 pages
Data Analytics Engineering Roadmap
No ratings yet
Data Analytics Engineering Roadmap
2 pages
Essentials of Data Engineering - Saini, DR - Mukesh - 2024 - Anna's Archive
No ratings yet
Essentials of Data Engineering - Saini, DR - Mukesh - 2024 - Anna's Archive
431 pages
AWSw 3
No ratings yet
AWSw 3
9 pages
30 Day Data Engineering Roadmap
No ratings yet
30 Day Data Engineering Roadmap
2 pages
Data Engineering Course Outline
No ratings yet
Data Engineering Course Outline
3 pages
Data Engineering Roadmap For Freshers & Resources
No ratings yet
Data Engineering Roadmap For Freshers & Resources
6 pages
Unit 2 Assignment
No ratings yet
Unit 2 Assignment
4 pages
AWS Data Engineer 6 Weeks Training Course Content
No ratings yet
AWS Data Engineer 6 Weeks Training Course Content
5 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
3 pages
Geetha Intern de
No ratings yet
Geetha Intern de
26 pages
Complete Roadma 2
No ratings yet
Complete Roadma 2
3 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
1 page
AWS Certified Data Engineer
No ratings yet
AWS Certified Data Engineer
693 pages
60 Day Data Lake DWH Plan Cost Analysis Full
No ratings yet
60 Day Data Lake DWH Plan Cost Analysis Full
3 pages
Iran
No ratings yet
Iran
7 pages
That
No ratings yet
That
4 pages
DE AWS Test (1) T
No ratings yet
DE AWS Test (1) T
74 pages
Data Engineers Instagram Story
No ratings yet
Data Engineers Instagram Story
8 pages
Tech Leap-AWS-Data-Engineer-TeachLeap-School-Final PDF
No ratings yet
Tech Leap-AWS-Data-Engineer-TeachLeap-School-Final PDF
14 pages
Ram Documentatation
No ratings yet
Ram Documentatation
56 pages

Aws Data Engineering Project

Uploaded by

Aws Data Engineering Project

Uploaded by

■ AWS Data Engineering Project Roadmap

1. Core AWS Services (Must-Know for Data Engineers)

2. Data Engineering Concepts You’ll Apply

3. Step-by-Step Project Example (Batch Pipeline)

4. Intermediate Project (Streaming Pipeline)

5. What to Learn Next (Priority Order)

You might also like