Hadoop administration | PPTXMore Related Content
PDF
Hadoop๊ณผ SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop) KEY
Distributed Programming Framework, hadoop PDF
แแ
กแแ
ฎแธแแ
ชแซแแ
งแจแแ
กแแ
ตแแ
ณ Ch9 PDF
PDF
PPT
Hadoop Introduction (1.0) PPTX
Tajo and SQL-on-Hadoop in Tech Planet 2013 PDF
20141029 ํ๋ก2.5์ hive์ค์น ๋ฐ ์์ What's hot
PDF
Java ์ด๋ณด์๋ฅผ ์ํ hadoop ์ค์ PPTX
ํ๋ก ์ค์น(์์ฌ๋ถ์ฐ๋ชจ๋) PDF
PDF
PDF
แแ
กแแ
ฎแธ แแ
ฉแแแ
ณแซแแ
ฃแจแแ
ตแแ
ตแแ
กแซ ๋ง๋ณํต์น์ฝ์ ์๋๋ค PDF
PDF
PPTX
PDF
Expanding Your Data Warehouse with Tajo PDF
ํ๋ก ์์๋ณด๊ธฐ(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop PDF
์์ธ ํ๋ก ์ฌ์ฉ์ ๋ชจ์ ๋ฐํ์๋ฃ PDF
SW1์ฐจ ํ๋ก์ ํธ Hive ์ต์ข
๋ฐํ PDF
PDF
ํ๋ก (Hadoop) ๋ฐ ๊ด๋ จ๊ธฐ์ ํ์ด๋ณด๊ธฐ PDF
PDF
PDF
PDF
ํ๋ก์๋ฒฝ๊ฐ์ด๋ Ch6. ๋งต๋ฆฌ๋์ค ์๋ ๋ฐฉ๋ฒ PDF
์๊ณ ์ฐ์! HBase | Devon 2012 PPTX
An introduction to hadoop Viewers also liked
PDF
Doug Cutting on the State of the Hadoop Ecosystem PPTX
20130506132258 ๋น
๋ฐ์ดํฐ์๋sns์์งํ-์ง์ฉ์[1] PDF
[2016 ๋ฐ์ดํฐ ๊ทธ๋๋ ์ปจํผ๋ฐ์ค] 2 3(๋น
๋ฐ์ดํฐ). ์์
๋น
๋ฐ์ดํฐ ์ ์ฉ ์ฌ๋ก ๋ฐ ํ๋ซํผ ๊ตฌํ PDF
DLAB company info and big data case studies PPTX
Enterprise Data Classification and Provenance PDF
Pivotal HAWQ แแ
ฉแแ
ข PPTX
Modernise your EDW - Data Lake PPTX
Security and Governance on Hadoop with Apache Atlas and Apache Ranger by Srik... PPTX
แแ
ฉแแ
ณแซแแ
ฉแแ
ณ แแ
ณแ
แ
ฉแแ
ฆแจแแ
ณ แแ
กแ
แ
กแแ
กแธแแ
ต_แแ
ฉแผแแ
ข PDF
Deview2013 SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom PDF
International Collaboration Networks in the Emerging (Big) Data Science PPTX
Multi User Data science with Zeppelin PDF
๋น
๋ฐ์ดํฐ ์๋ฃจ์
์๊ฐ์(2013๋
05์) PPTX
Discover HDP 2.1: Using Apache Ambari to Manage Hadoop Clusters PPTX
PPTX
PPTX
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim PDF
(130105) #fitalk trends in d forensics (dec, 2012) PDF
PDF
Similar to Hadoop administration
PDF
PPTX
Hadoop distributed file system rev3 PDF
log-monitoring-architecture.pdf PDF
Hadoop engineering v1.0 for dataconference.io PDF
2013.02.02 ์ง์ค์ ํ
ํฌ๋์ปฌ ์ธ๋ฏธ๋ - ํ๋ก์ผ๋ก ๋ฐฐ์ฐ๋ ๋์ฉ๋ ๋ฐ์ดํฐ ๋ถ์ฐ์ฒ๋ฆฌ ๊ธฐ์ (์ดํ๋จ) PPTX
2015๋
์ 2ํ ๋์๋ฆฌ ํด์ปค ์ธ๋ฏธ๋ - ๊ฒ์๊ฐ๋ฐ๊ณผ ๊ฒ์์์์ ๋น
๋ฐ์ดํฐ (9๊ธฐ ๋ฐ๊ฒฝ์ฌ) PDF
์ 16ํ ๋ณด์์ฆ(BOAZ) ๋น
๋ฐ์ดํฐ ์ปจํผ๋ฐ์ค - [ํ๋ก๋ฉ์ดํธ ํ] : ํ๋ก ์ค์ ๊ณ ๋ํ ๋ฐ ๋งต๋ฆฌ๋์ค ๋ชจ๋ํฐ๋ง PDF
Spark ์ ํต์ฌ์ ๋ฌด์์ธ๊ฐ? RDD! (RDD paper review) PDF
RHive tutorial supplement 1: RHive ํํ ๋ฆฌ์ผ ๋ถ๋ก 1 - Hadoop ์ค์น PPT
PDF
20180714 ํ๋ก ์คํฐ๋ ์ข
๋ฃ ๋ณด๊ณ ๋ฐ ์ฐ๊ตฌ๊ณผ์ ๋ฐํ์๋ฃ PDF
OpenSource Big Data Platform - Flamingo ์๊ฐ์ ํ์ฉ PDF
PDF
OpenSource Big Data Platform : Flamingo Project PDF
OpenSource Big Data Platform - Flamingo v7 PPTX
PPT
PPTX
Big data application architecture ์์ฝ2 PDF
ํ๋ก ๋งต๋ฆฌ๋์ค ํ์ด๋ณด๊ธฐ PDF
Hnavi-HDFS based log aggregater with HDFS Browser Hadoop administration
- 1.
- 2.
2 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop 2.0; Glance at YARN
CONTENTS
- 3.
3 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 4.
4 9/27/2013
โข ๋๊ตฌ๋Mobile device
โข Facebook, Twitter ๋ฑ์ ์๋น์ค ํฌํ
> 100์ต์ฅ์ ์ฌ์ง ๏ ์ PB ์คํ ๋ฆฌ์ง
โข ์ด๋ํต์
> ์๊ฐ๋น 250 GB ์ด์
> ํ๋ฃจ 6TB
> 1๋
, 5๋
, 10๋
?
โข IT ์๋น์ค ์ตํฉ
> Mobile + Biz(๊ธ์ต, ์ผํ ๋ฑ)
Data paradigm shift
10244
10245
10248
10246
10247
- 5.
5 9/27/2013
โข Change๏จ Chance
Big Data = Big Chance
2011๋
2012๋
2013๋
1 ํด๋ผ์ฐ๋ ์ปดํจํ
๋ฏธ๋์ด ํ๋ธ๋ฆฟ ์ดํ ๋ชจ๋ฐ์ผ ๊ธฐ๊ธฐ ๋์
2
๋ชจ๋ฐ์ผ ์ฑ๊ณผ ๋ฏธ๋์ด
ํ๋ธ๋ฆฟ
๋ชจ๋ฐ์ผ ์ค์ฌ ์ ํ๋ฆฌ์ผ์ด์
๊ณผ
์ธํฐํ์ด์ค
๋ชจ๋ฐ์ผ ์ฑ๊ณผ HTML5
3
์์
์ปค๋ฎค๋์ผ์ด์
๋ฐ
ํ์
์ํฉ์ธ์๊ณผ ์์
์ด ๊ฒฐํฉ๋ ์ฌ์ฉ์
๊ฒฝํ
ํผ์ค๋ ํด๋ผ์ฐ๋
4 ๋น๋์ค M2M IoT
5 ์ฐจ์ธ๋ ๋ถ์ ์ฑ์คํ ์ด์ ๋ง์ผ ํ๋ ์ด์ค
ํ์ด๋ธ๋ฆฌ๋ IT์ ํด๋ผ์ฐ๋
์ปดํจํ
6 ์์
๋ถ์ ์ฐจ์ธ๋ ๋ถ์ ์ ๋ต์ ๋น
๋ฐ์ดํฐ
7 ์ํฉ์ธ์ ์ปดํจํ
๋น
๋ฐ์ดํฐ ์คํ ๊ฐ๋ฅํ ๋ถ์
8 ์คํ ๋ฆฌ์ง๊ธ ๋ฉ๋ชจ๋ฆฌ ์ธ๋ฉ๋ชจ๋ฆฌ ์ปดํจํ
์ธ๋ฉ๋ชจ๋ฆฌ ์ปดํจํ
9 ์ ๋น์ฟผํฐ์ค ์ปดํจํ
์ ์ ๋ ฅ ์๋ฒ ํตํฉ ์์ฝ์์คํ
10 ํจ๋ธ๋ฆญ ๊ธฐ๋ฐ ์ปดํจํ
ํด๋ผ์ฐ๋ ์ปดํจํ
์ํฐํ๋ผ์ด์ฆ ์ฑ์คํ ์ด
Data ๊ด๋ฆฌ
- ์์ฐ
- ๊ด๋ฆฌ
- ํ์ฉ
- 6.
- 7.
7 9/27/2013
โข ๋ฐ์ดํฐ๋ฅผ์์งํ๊ณ ์ฒ๋ฆฌํ๋๋ฐ ๋ง์ ์๊ฐ๊ณผ ๋น์ฉ์ด ๋ฌ
> ์ธํ๋ผ์ ๊ตฌ์กฐ, ๋ฐ์ดํฐ ์ผํฐ ์์ฉ ๊ฐ๋ฅ์ฑ
> ๊ธฐ์กด ์ธํ๋ผ๋ ๋
๋ฆฝ์ ์์คํ
, ์ ํ๋ฆฌ์ผ์ด์
๊ฐ๋ฐ, ์ ์ง๋ณด์
> ํ๋ซํผ์ด ํ์
โข ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ ์ ์๋ ๊ฐ์ผ(?) ๊ตฌ์กฐ
> HDFS
โข ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌ๋ฅผ ์ํ Bundling Framework
> Map + Reduce
โข Logic on Data
> Data Locality ๋ณด์ฅ
โข I/O ์ง์ค์ ์ด๋ฉด์ CPU ์ฐ์ฐ
> ํ์ผ์ฒ๋ฆฌ ์ฌ๊ณ , ๋ฉํฐ๋
ธ๋ ๋ถํ๋ถ์ฐ ์ฌ์
โข ํ๋์จ์ด ์ถ๊ฐ์ ์ฑ๋ฅ Linear
> ๊ฒฐ๊ตญ, DB ๋ณด๋ค ์ฒด๊ฐ์๋ ์กด์ฌ ํจ
Why Hadoop
- 8.
- 9.
- 10.
10 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 11.
11 9/27/2013
โข POSIX์๊ตฌ์ฌํญ ์ผ๋ถ๋ฅผ ๋ง์กฑ
โข ๋ค์์ ๋
๋ฆฝ ๋จธ์ ์ผ๋ก ์์คํ
์ผ๋ก ์ฑ๋ฅ๊ณผ ๋น์ฉ์ ๋ชจ๋ ๋ง์กฑ
โข ์๋ฐฑ๋ง ๊ฐ์ ์์ญ ๊ธฐ๊ฐ๋ฐ์ดํธ ํฌ๊ธฐ์ ํ์ผ์ ์ ์ฅ ๊ฐ๋ฅ
> ์์ญ PB ์ด์๋ ๊ฐ๋ฅ
โข Scale out ๋ชจ๋ธ
> ๋์ฉ๋ ์คํ ๋ฆฌ์ง ๊ตฌ์ฑ์ ์ํด RAID ๋์ JBOD๋ฅผ ์ง์
> ์ ํ๋ฆฌ์ผ์ด์ ์์ค์ ๋ฐ์ดํฐ ๋ณต์ ๋ก ๊ฐ์ฉ์ฑ ํ๋ณด์ ๋์ ์ฑ๋ฅ ์ ์ง
โข ํฐ ํ์ผ์ ์คํธ๋ฆฌ๋ฐ ์ฝ๊ธฐ์ ์ฐ๊ธฐ์ ๋ ์ต์ ํ
> ํ๋ก์ ๋ค์์ ์์ ํ์ผ์ ๋ํ ๋งค์ฐ ๋๋ฆฐ ์๋ต
> ๋ฐฐ์น ์คํ์ด ์๋ต ์๋๋ณด๋ค ๋ ์ค์
โข Fault Tolerance
> ๋จธ์ ๊ณผ ๋์คํฌ ๋ฑ์ ์ปดํฌ๋ํธ ์คํจ์ ๋์ฒ
โข ๋งต๋ฆฌ๋์ค Framework ์ฐ๊ณ ๊ฐ๋ฅํด์ผ ํจ
HDFS Goal and Motivation
- 12.
12 9/27/2013
โข UserLevel File System
> ์ปค๋ ์ธ๋ถ์์ Application์ด ์ํ ๋จ, System Mount ๋ถํ์
> FUSE ์ฌ์ฉ ์์๋?
โข Distributed File System
โข Disk Block Size
> Default Size ๏ 64M
> 128MB, 256MB, 1GB ๋๋ฆด ์ ์์(Trade-off)
> ์ ๋ธ๋ก ์ฌ์ด์ฆ๋ฅผ ๋๋ฆด๊น? ๋๋ผ์ด๋ธ ํ์ ์กฐ์ ์ต์ํ I/O ์ฑ๋ฅ ํฅ์
โข Data Protection
> ์ฌ๋ฌ ๋จธ์ ์ ๋ฐ์ดํฐ ๋ธ๋ก ๋ณต์
> ๋ฐ์ดํฐ๋ ํ ๋ฒ ์ฐ๊ฒ ๋๋ฉด ์์ ๋ถ๊ฐ๋ฅ
> ๋ฐ์ดํฐ READ ์์๋ ๋ณต์ ์ค ํ๋๋ง ์ฝ์
โ ๋คํธ์ํฌ ์ ๊ฐ์ฅ ๊ฐ๊น์ด ๋จธ์ ์ ๋ ํ๋ฆฌ์นด์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๊ฒ ๋จ
HDFS Design
- 13.
13 9/27/2013
โข ๋ค์๋
ธ๋(NameNode)
>ํ์ผ์์คํ
๋ฉํ๋ฐ์ดํฐ ์ ๋ถ ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅ
> 1๋ฐฑ๋ง ๋ธ๋ก์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ธฐ ์ํด 1GB์ Heap ํ์
โข ๋ณด์กฐ ๋ค์๋
ธ๋(Secondary NameNode)
> ๋ฐฑ์
์ ์ฉ๋๋ ์๋
> ๋ค์๋
ธ๋ ์ด๋ฏธ์ง๋ฅผ ๊ด๋ฆฌ, ์ผ์ข
์ Check Pointer Server
HDFS Daemon
Daemon ํด๋ฌ์คํฐ๋น ๊ฐ์ ์ฉ๋
๋ค์๋
ธ๋ 1 ํ์ผ์์คํ
์ ๋ฉํ๋ฐ์ดํฐ ์ ์ฅ,
ํ์ผ์์คํ
์ ๊ธ๋ก๋ฒ ์ด๋ฏธ์ง ์ ๊ณต
๋ณด์กฐ ๋ค์๋
ธ๋ 1 ๋ค์๋
ธ๋ ํธ๋์ญ์
๋ก๊ทธ์ ์ฒดํฌํฌ์ธํธ
์์
์ํ
๋ฐ์ดํฐ๋
ธ๋ ๋ค์ ๋ธ๋ก ๋ฐ์ดํฐ ์ ์ฅ(ํ์ผ๋ด์ฉ)
- 14.
14 9/27/2013
HDFS ๋์๋ฐฉ์(Read)
NameNode
Secondly
Name Node
Data Node Data Node Data Node Data Node Data Node
rack1 rack2
HDFS
Application
Hadoop Client
1. ํ์ผ๊ฒฝ๋ก: /foo/bar/test.txt ์์ฒญ
2. ๋ธ๋ก1, ํธ์คํธโฆ ์๋ต
Host1 Host2 Host3
3. ๋ธ๋ก1 ์ฝ๊ธฐ ์์ฒญ
4. ๋ฐ์ดํฐ ์๋ต
- 15.
15 9/27/2013
HDFS ๋์๋ฐฉ์(Write)
NameNode
Secondly
Name Node
Data Node Data Node Data Node Data Node Data Node
rack1 rack2
HDFS
Application
Hadoop Client
1. ํ์ผ ์์ฑ์ ์ํ ํ์ผ๊ฒฝ๋ก ์์ฑ ์์ฒญ
- ํ์ผ๊ฒฝ๋ก: /foo/bar
- ๋ณต์ ๋ณธ์: 3
Memory
2.1 ํ์ผ ๊ฒฝ๋ก ์ ๋ณด ์์ฑ(๋ฉ๋ชจ๋ฆฌ์ ์์ฑ)
2.2 ๋ฝ ์์ฑ(๋ค๋ฅธ ํด๋ผ์ด์ธํธ๊ฐ ์์ฑํ์ง ๋ชปํ๊ฒ)
Host1 Host2
3.1ํ์ผ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ ๋ฐ์ดํฐ ๋
ธ๋ ์ ํ ํ
ํธ์คํธ ์ ๋ณด ๋ฐํ (Host1, Host2, Host3)
4. ํ์ผ ๋ฐ์ดํฐ ๋ฐ ๋ฐ์ดํฐ ๋
ธ๋ ๋ชฉ๋ก ์ ์ก
Host3
5.1 ๋ก์ปฌ์ ์ฅ 5.2๋ณต์ ๋ณธ ์ ์ฅ 5.3๋ณต์ ๋ณธ ์ ์ฅ
edits
5.4 ์ ์ฅ์๋ฃ (close()๋ช
๋ น)
6. ๋ฉ๋ชจ๋ฆฌ์ ๋ด์ฉ์ edits ํ์ผ์ ๊ธฐ๋ก(๋ค์์คํ์ด์ค ๋ฑ๋ก)
์ ํด์ง ๋ธ๋กํฌ๊ธฐ๋ฅผ ๋์ด์๋ฉด
ํด๋ผ์ด์ธํธ๋ ๋ค์ ๋
ธ๋๋ก
์๋ก์ด ๋ฐ์ดํฐ ๋
ธ๋ ์์ฒญ
fsimage
์ฃผ๊ธฐ์ ์ผ๋ก ๋ค์ด๋ก๋ ํ
edits์ fsimage ๋ณํฉ
fsimage ํ์ผ์
Name Node๋ก ์ ์ก
- 16.
16 9/27/2013
HDFS ๋์๋ฐฉ์(๋ฉํ๋ฐ์ดํฐ)
NameNode
Secondly
Name Node
1. edit ํ์ผ ํ์ (๋ณด๊ด, edits.new ์์ฑ)
2. fsimage์ edits ํ์ผ ๋ณต์ฌ
4. ์๋ก์ด fsimage ํ์ผ ์ ์ก
Disk
3. ๋ ํ์ผ์ ์ฝ์ด์ edits ๋ฅผ ๋ฐ์,
์๋ก์ด fsimage ํ์ผ ์์ฑ5. edits.new ํ์ผ๋ช
์ edits๋ก ๋ณ๊ฒฝ
Disk
โข ๋งค์๊ฐ(๊ธฐ๋ณธ๊ฐ) ๋๋ ๋ค์๋
ธ๋ edits ํ์ผ์ ํฌ๊ธฐ๊ฐ 64MB๊ฐ ๋๋ฉด ๋ฐ์
โข ์ต๊ทผ ํ๋ก๋ฒ์ ์ ํธ๋์ญ์
๊ฐ์ ๊ธฐ์ค์ผ๋ก ์ฒดํฌ ํฌ์ธํธ๋ฅผ ์ํ
- 17.
17 9/27/2013
NFS
โข HadoopNameNode๋ SPOF
โข ๋ฐ๋ผ์ HA ๊ตฌ์กฐ๋ก ๋ง๋ค์ด์ผ ํจ
โข HA ๊ธฐ๋ณธ ๊ธฐ๋ฅ์ Hadoop 1.x ๋ฒ์ ์ดํ์์๋ ์กด์ฌํ์ง ์์
> Hadoop 2.0(YARN)์ ๊ฐ์ฅ ์ธ๊ธฐ์๋ ๊ธฐ๋ฅ
โข NFS, Zookeeper ๋ฑ์ ์ด์ฉํ์ฌ HA ๊ตฌํ
Hadoop HA(NameNode)
Zookeeper
Quorum
๋ณต๊ตฌ
์ปจํธ๋กค๋ฌ
๋ณต๊ตฌ
์ปจํธ๋กค๋ฌ
๋ค์๋
ธ๋(Ac
tive)
๋ค์๋
ธ๋(St
andby)
๋ฉํ๋ฐ์ด
ํฐ
๊ณต์
๋ฉํ๋ฐ์ด
ํฐ
๋ฉํ๋ฐ์ด
ํฐ
* ๊ทธ ๋ฐ์ ํ๋๋ ์ด์
๊ตฌ์กฐ๊ฐ ์์
- 18.
18 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 19.
19 9/27/2013
โข MapReduceFramework ์ฌ์
> Logic on Data; Data Locality ๋ฐ์
โข MapReduce: Simplified Data Processing on Large Clusters
โข ๊ฐ๋ฐ ๋จ์์ฑ
> ํ ๋ฒ์ ํ๋์ ๋ ์ฝ๋๋ง์ ๋ค๋ฃจ๋ ๋ฐ์ด์ฒ ์ฒ๋ฆฌ ํ๋ก๊ทธ๋จ๋ง ์์ฑํ๋ฉด ๋จ
> ํ์ง๋ง, Functionality Programming ๊ฐ๋
์ ์์ง; KEY-VALUE
โ ์ฌ์ค, Java MapReduce ๋ ๋ณ์ข
> Filtering, Projection, Grouping, Aggregation ๋ฑ์ ๊ตฌํ
โข ํ์ฅ์ฑ
> ํ์คํฌ๋ค์ ์๋ก ํต์ ํ๊ฑฐ๋, ์ํ๋ฅผ ๊ณต์ ํ์ง ์๊ณ ๋ถ์ฐ๋ ๋จธ์ ์์
๋ณ๋ ฌ ์ํ
โข ๋ด๊ณ ์ฅ์ฑ
> ์คํจ๋ ์์ธ๊ฐ ์๋๋ผ ํญ์ ์ผ์ด๋๋ ์ผ
> ํด๋ฌ์คํฐ์ ์์ปค ๋
ธ๋์์ ํ์คํฌ๊ฐ ์คํจํ๋ฉด ๋ค์ ์๋
MapReduce ์ Features
- 20.
20 9/27/2013
โข (1)Job summit ๏จ (2) Map Task ๏จ (3) Shuffling& Sort ๏จ (4) Reduce Task
MapReduce 4๋จ๊ณ ์ฒ๋ฆฌ
- 21.
21 9/27/2013
โข JobTracker
> 1๊ฐ์
> Client์ Task Tracker์ RPC ํต์ ์ํ
> Task Tracker๋ Heartbeat์ผ๋ก ์ํ๊ณผ ์ ๋ณด๋ฅผ ๋ณด๋ด ์ค
> Job Configuration ์ฑ
์
โข Task Tracker
> ์ฌ์ฉ์ ์ฝ๋๋ฅผ ์ํํ๋ ๋ฐ๋ชฌ
> Job Tracker์๊ฒ ์ฃผ๊ธฐ์ ์ผ๋ก ์งํ๊ณผ์ ๋ณด๊ณ
> Job Tracker๋ก๋ถํฐ ํ ๋น ๋ฐ์ผ๋ฉด ์๋ก์ด ํ๋ก์ธ์ค ๋ง๋ค์ด Task
Attemptํจ
โ Task vs. Task Attempt
MapReduce Daemon
- 22.
22 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 23.
23 9/27/2013
1. ํ๋ก๋ฐฐํฌํ ๋ฒ์ ์ ํ
2. ํ๋์จ์ด ์ ํ
3. ์ด์์ฒด์ ์ ํ๊ณผ ์ค๋น ์ฌํญ
4. ์ปค๋ ํ๋
5. ๋คํธ์ํฌ ์ค๊ณ
Cluster Planning
- 24.
24 9/27/2013
โข ApacheHadoop vs. Packaging Hadoop
> Apache Hadoop
> Hortonworks
> Cloudera
ํ๋ก ํจํฌํ๊ณผ ๋ฒ์ ์ ํ
- 25.
25 9/27/2013
โข 20๋๋ฏธ๋ง ํด๋ฌ์คํฐ(์ํ ํด๋ฌ์คํฐ) ๋ง์คํฐ ํ๋์จ์ด ์ ๋น์ฉ ํฌ์
> CPU: 2.6GH, ์ฟผ๋์ฝ์ด CPU 2๊ฐ
> MEM: DDR3 RAM 24GB
> NT: 1GB NIC 2๊ฐ
> Controller: SAS ๋๋ผ์ด๋ฒ Controller, SAS II(OS ๋๋ฐ์ด์ค JBOD)
> Disk Storage: ์ต์ 1TB ์ด์
โข 300๋ ๋ฏธ๋ง
> Memory๋ง 24GB ํน์ 48GB
โข ๋ํ Cluster
> Memory 96GB
ํ๋์จ์ด ์ ํ
๊ตฌ๋ถ ๋์ ๊ณ ๋ ค์ฌํญ
๋ง์คํฐ
ํ๋์จ์ด
์ ํ
๋ค์๋
ธ๋ โข ๋
๋ฆฝ๋จธ์ , ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅ
โข CPU๋ณด๋ค ๋ฉ๋ชจ๋ฆฌ ์์ฃผ
๋ณด์กฐ
๋ค์๋
ธ๋
โข ๋ค์๋
ธ๋์ ๊ฐ์, ๋์ผํ ๋ฉ๋ชจ๋ฆฌ, ๋์คํฌ ์ฉ๋
ํ์
์ก ํธ๋์ปค โข ๋ง์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ฌ์ฉ, ๋ค์๋
ธ๋์ ๊ฐ์ Spec
- 26.
26 9/27/2013
ํ๋์จ์ด ์ ํ
๊ตฌ๋ถ๋์ ๊ณ ๋ ค์ฌํญ
์์ปค
ํ๋์จ์ด
์ ํ
๋ฐ์ดํฐ ๋
ธ๋ โข ์ ์ฅ๊ณผ ๊ณ์ฐ ๋ ์ญํ ๋ชจ๋ ํจ
โข ๋ฐ๋ผ์ CPU, Disk Storage ๊ณ ๋ ค
โข ๋ณต์ ๊ณ์, X 3
โข MapReduce ์์ ์ ์ฅ, 20~30% ์ถ๊ฐ ์ ์ฅ
โข ๋ฉ๋ชจ๋ฆฌ ๋ณด๋ค, Disk ์์ฃผ
โข ์ฐ์ฐ์ ์ํ CPU ์ ํ
ํ์คํฌ
ํธ๋์ปค
์ค๊ธ(๋ง์ ๋ฉ๋ชจ๋ฆฌ, ๋ง์ ๋์คํฌ, 1GB ์ด๋๋ท) ๊ณ ๊ธ(๋์ฉ๋ ๋ฉ๋ชจ๋ฆฌ, ์ด๊ณ ์ ๋์คํฌ, 10GB
์ด๋๋ท)
โข CPU: 2.9GHz, 15MB ์บ์ 6์ฝ์ด CPU 2๊ฐ
โข ๋ฉ๋ชจ๋ฆฌ: DDR3-1600 ECC 64GB
โข ๋์คํฌ ์ปจํธ๋กค๋ฌ: SAS 6GB/S 1๊ฐ
โข ๋์คํฌ: 3TB LFF SATA II 7200 RPM HDD 12๊ฐ
โข ๋คํธ์ํฌ: 1GB ์ด๋๋ท 2๊ฐ
โข ๋น๊ณ : ์ธํ
ํ์ดํผ ์ฐ๋ ๋ฉ QPI ๊ธฐ๋ฅ ๊ถ์ฅ
โข 3 ๋๋ 4 ์ฑ๋ ๋ฉ๋ชจ๋ฆฌ ์ค์
โข CPU: 2.9GHz, 15MB ์บ์ 6์ฝ์ด CPU 2๊ฐ
โข ๋ฉ๋ชจ๋ฆฌ: DDR3-1600 ECC 96GB
โข ๋์คํฌ ์ปจํธ๋กค๋ฌ: SAS 6GB/S 2๊ฐ
โข ๋์คํฌ: 3TB LFF SATA II 7200 RPM HDD 24๊ฐ
โข ๋คํธ์ํฌ: 10GB ์ด๋๋ท 1๊ฐ
โข ๋น๊ณ : ์ธํ
ํ์ดํผ ์ฐ๋ ๋ฉ QPI ๊ธฐ๋ฅ ๊ถ์ฅ
โข 3 ๋๋ 4 ์ฑ๋ ๋ฉ๋ชจ๋ฆฌ ์ค์
- 27.
27 9/27/2013
โข Scaleup ๋์ Scale out
โข ๊ฐ์ํ๋ฅผ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ์ง ์๋๋ค.
> ๋ฒ ์ด๋ฉํ ๋ฑ์ ํ์ดํผ๋ฐ์ด์ ๋ I/O ์ฑ๋ฅ์ ์ํฅ์ ์ค
ํ๋์จ์ด ์ ํ: ํด๋ฌ์คํฐ ๊ท๋ชจ ๊ฒฐ์
์ผ์ผ ์์ง ์ฉ๋ 1TB
๋ณต์ ์ธ์ 3(๋ธ๋ก ์ฌ๋ณธ ์)
์ผ์ผ ์ค์ ์ฉ๋ 3TB ์ผ์ผ์์ง ์ฉ๋ X ๋ณต์ ์ธ์
๋
ธ๋ ์ ์ฅ ์๋ 24TB 2TB SATA II HDD 12๊ฐ
๋งต๋ฆฌ๋์ค ์์ ๋ฐ์ดํฐ ์ฉ๋ 25% ๋งต๋ฆฌ๋์ค ์์ ๋ฐ์ดํฐ
๋
ธ๋ ๊ฐ์ฉ ์ ์ฅ์ ์ฉ๋ 18TB ๋
ธ๋์ ์ฅ์ฉ๋ โ ๋งต๋ฆฌ๋์ค ์์ ๋ฐ์ดํฐ
์ฉ๋
1๋
61 ๋
ธ๋ ์ผ์ผ์์ง์ฉ๋ X ๋ณต์ ์ธ์ X 365 / ๋
ธ๋
๊ฐ์ฉ ์ ์ฅ์ ์ฉ๋
1๋
(๋งค์ 5% ์ฆ๊ฐ) 81 ๋
ธ๋
1๋
(๋งค์ 10% ์ฆ๊ฐ) 109 ๋
ธ๋
- 28.
28 9/27/2013
โข RedHat,CentOS, Ubuntu, SuSE ๋ฑ ๋ฆฌ๋
์ค ์ด์์ฒด์ ์ต์ ํ
โข Puppet, Chef ๋ฑ์ ์ค์ ๊ด๋ฆฌ ์์คํ
ํ์(์คํ์์ค)
โข ์ํํธ์จ์ด
> Oracle Java 1.6 ์ด์
โ Hadoop RPM ์ฌ์ฉํ๋ ค๋ฉด, Oracle Java๋ RPM ๋ฒ์ ์ผ๋ก ์ค์น
> Cron Daemon
> ntp
> SSH
> SNTP
> rsync
โข Hostname, DNS ์ธ์
> /etc/hostname, /etc/hosts, java dns
์ด์์ฒด์ ์ ํ๊ณผ ์ค๋น์ฌํญ
- 29.
29 9/27/2013
๋ฐ๋ชฌ ์์น์ค์ ๋งค๊ฐ๋ณ์ ์์ ์:๊ทธ๋ฃน ๊ถํ
NameNode /data/1/dfs/nn,
/data/2/dfs/nn,
/data/3/dfs/nn
dfs.name.dir hdfs:hadoop 0700
Secondary Name
Node
/data/1/dfs/snn fs.checkpoint.dir hdfs:hadoop 0700
DataNode /data/1/dfs/dn,
/data/2/dfs/dn,
/data/3/dfs/dn
dfs.datanode.dir hdfs:hadoop 0700
Task Tracker /data/1/mapred/local,
/data/2/mapred/local,
/data/3/mapred/local,
mapred.local.dir mapred:hadoop 0700
Job Tracker /data/1/mapred/local mapred.local.dir mapred:hadoop 0700
์ ์ฒด /var/log/hadoop
/tmp/hadoopuser.name
$HADOOP_LOG_DIR
hadoop.tmp.dir
root:hadoop
root:root
0775
1777
Directory Layout
- 30.
30 9/27/2013
โข ์ปค๋๋งค๊ฐ๋ณ์ /etc/sysctl.conf ์ค์
> ๋ฐ๋์ ์ฌ์์ํด์ผ ๋ฐ์
โข vm.swappiness
> ๋ฐ์ดํฐ์ ๋ฉ๋ชจ๋ฆฌ๊ฐ์ SWAP
> 0~100, ์์น๊ฐ ๋์์๋ก ๋ฐ์ดํฐ๋ฅผ ๋ ๋ง์ด ์ค์
> ๋๋ต 60~80์ด๋ฉด ์ ๋น
โข Vm.overcommit_memory
> malloc() ํจ์ ํธ์ถํ์ฌ ๋ฉ๋ชจ๋ฆฌ ํ ๋น ์ต์
> 0: ๋ฉ๋ชจ๋ฆฌ๊ฐ ์ถฉ๋ถํ๋ฉด ์ ํ๋ฆฌ์ผ์ด์
๋ฉ๋ชจ๋ฆฌ ํ ๋น
> 1: ๋ฌผ๋ฆฌ ๋ฉ๋ชจ๋ฆฌ ์ด๊ณผํ ๋ vm.overcommit_ratio ๊ธฐ์ค์ผ๋ก ์ค์ํ ํ ๋น
โ ratio 50์ด๊ณ , ๋ฌผ๋ฆฌ ๋ฉ๋ชจ๋ฆฌ 1GB์ด๋ฉด ์ปค๋ ์ค์ ํฌํจํด์ 1.5GB
> 2: ์ปค๋์ ์ ํ๋ฆฌ์ผ์ด์
๋ฉ๋ชจ๋ฆฌ ํ ๋น ์์ฒญ์ ๋ฌด์กฐ๊ฑฐ ์์ฉ
โ ์ ๋ ๊ถ๊ณ ํ์ง ์์
์ปค๋ ํ๋
- 31.
31 9/27/2013
โข ๋ฆฌ๋
์ค์LVM ์ฌ์ฉ ๊ธ์ง
> /dev/sd* ์๋ /dev/vg* ์ด๋ฉด ์ ๋ชป๋ ์ค์
โข ๋๋ถ๋ถ ์ด์์ฒด์ ํ์ผ์์คํ
๋ฐ๋ผ ๊ฐ
> ext3, ext4, xfs
โข ํญ์ ๋ง์ดํธ ์ต์
์ ์ถ๊ฐํด์ผ ํจ
๋์คํฌ ์ค์
- 32.
32 9/27/2013
โข ๊ผญ๋คํธ์ํฌ ์์ง๋์ด์ ํจ๊ป ์ค๊ณํด์ผ ํจ
โข ๊ณ ๋ฆฝ๋ ๋คํธ์ํฌ๊ฐ ์ต์
โข 1,152 ์ง์ ์ฅ๋น
> Cisco Nexus 7000
> ์คํ์ธ ํจ๋ธ๋ฆญ ์ค์์น 2๊ฐ
๋คํธ์ํฌ ์ค๊ณ
48x10GbE
48x10GbE
4 x 10GbE
48x10GbE
4 x 10GbE
48x10GbE
4 x 10GbE
Host Host Host
- 33.
33 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 34.
34 9/27/2013
โข ApacheHadoop
> Tarball ๊ฒฝ์ฐ ์์ถํด์ ๋ก ๋
> ์ ๋ฌธ์ ๊ด๋ฆฌ๋ฅผ ์ํด ๋๋ ํฐ๋ฆฌ ์์น ์กฐ์ ๊ฐ๋ฅ
โข Cloudera, Hortonworks
> Installation Manager๊ฐ ์กด์ฌ
> Cloudera Manager
> Hortonworks Management Center
ํ๋ก ๋ฐฐํฌํ์ ๋ฐ๋ผ์
- 35.
35 9/27/2013
โข ๋ฒ์ ๊ด๋ฆฌ๊ฐ ์ฉ์ด
โข ๋๋ ํ ๋ฆฌ ์์น ์ผ๊ด์ฑ
> /etc/hadoop
โ conf ๋๋ ํฐ๋ฆฌ(๋ค์ฅ์ ์ค๋ช
)
> /etc/rc.d/init.d
โ ๋ฐ๋ชฌ ํ์์ ์์/์ข
๋ฃ/์ฌ์ ์คํฌ๋ฆฝํธ
> /usr/bin
โ hadoop ์คํํ์ผ๊ณผ ํ์คํฌ ์ปจํธ๋กค๋ฌ ๋ฐ์ด๋๋ฆฌ ํ์ผ
> /usr/include/hadoop
โ ํ๋ก ํ์ดํ๋ฅผ ์ํ C++ ํค๋ ํ์ผ
> /usr/lib
โ ํ๋ก C ๋ผ์ด๋ธ๋ฌ๋ฆฌ
> /usr/libexec
> /usr/sbin/
> /usr/share/doc/hadoop
RPM ํจํค์ง ์ฌ์ฉํ์ ๊ฒฝ์ฐ
- 36.
36 9/27/2013
โข hadoop-env.sh
โขcore-site.xml
โข hdfs-site.xml
โข mapred-site.xml
โข log4j.properties
โข masters
โข slaves
โข fair-scheduler.xml
โข capacity-scheduler.xml
โข dfs.include
โข dfs.exclude
โข hadoop-policy.xml
โข mapred-queue-acls.xml
โข taskCtrller.cfg
Hadoop conf ๋๋ ํฐ๋ฆฌ ์๋ ํ์ผ
Configuration Framework ํต์ฌ
<configuration>
<property>
<name></name>
<value></value>
<finale></final>
</property>
<configuration>
- 37.
- 38.
38 9/27/2013
name value์ค๋ช
fs.default.name(core-site.xml) hdfs://centos1:9000 ํ์ผ์์คํ
์ URL ์ง์
dfs.name.dir /data/1/dfs/nn ๋ค์๋
ธ๋ ๋ฉํ๋ฐ์ดํฐ ์ ์ฅ์
dfs.data.dir /data/1/dfs/dn ๋ฐ์ดํฐ ๋
ธ๋ ๋ธ๋ก ์ ์ฅ์
fs.checkpoint.dir /data/1/dfs/snn ์ฒด์ฝํฌ์ธํธ ๋ฉํ๋ฐ์ดํฐ ์ ์ฅ์
dfs.permission.supergroup hadoop ์ํผ์ ์ ๊ทธ๋ฃน์ผ๋ก ๋ชจ๋ HDFS
์กฐ์์ํ
io.file.buffer.size(core-site.xml) 65536 IO๋ฒํผ ํฌ๊ธฐ ํด์๋ก ๋คํธ์ํฌ
์ ์กํจ์จ ๋์์ง ํ์ง๋ง, ๋ฉ๋ชจ๋ฆฌ
์๋น์ ์ง์ฐ์๊ฐ๋ ๋์ด๋จ
dfs.balance.bandwidthPerSec ๋ถ์ฐ๋ ๋ธ๋ก์ ๊ท ํ์ ๋ง์ถ๊ธฐ ์ํ
๋๊ตฌ
dfs.block.size 134217728 ์๋ก์ด ํ์ผ์ด ์์ฑ์ ํ์ํ ๋ธ๋ก
ํฌ๊ธฐ
fs.trash.interval (core-site.xml) 1440(24์๊ฐ) ํด์งํต ๊ธฐ๋ฅ
HDFS Configurations(hdfs-site.xml)
โข dfs.datanode.du.reserved,
โข dfs.namenode.handler.count,
โข dfs.datanode.failed.volumes.tolerated
โข dfs.hosts
โข dfs.host.exclude
- 39.
39 9/27/2013
MapReduce Configurations(mapred-site.xml)
namevalue ์ค๋ช
mapred.job.tracker hdfs://centos1:9000 Job Tracker URL scheme
mapred.local.dir /data/1/mapred/local ๋ก์ปฌ ๋์คํฌ์ ์์ ์ถ๋ ฅ์ ์ ์ฅ
mapred.java.child.opts -Xmx2g JVM ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ ๊ณต๊ฐ์
mapred.child.ulimit 1572864 ํ์คํฌ์ ๊ฐ์ ๋ฉ๋ชจ๋ฆฌ ์ฉ๋์ ์ ํ
mapred.tasktracker.map.tasks.maximu
m
16 ๊ฐ ๋จธ์ ์ด ๋์์ ์คํํ ์ ์๋ ํ์คํฌ
์๋
mapred.tasktracker.reduce.tasks.
maximum
8 ๊ฐ ๋จธ์ ์ด ๋์์ ์คํํ ์ ์๋ ํ์คํฌ
์๋
mapred.compress.map.output org.apache.io.compress.SnappyCodec ๋ฑ ํ์คํฌ์ ์ถ๋ ฅ์ ๋์คํฌ์ ์ ์ฅํ ๋ ๊ธฐ๋ณธ
์ค์
mapred.output.compression.type BLOCK maprecl.output.compression.
type ์ ์ง์ ๋ ์์ถ ๋ฐฉ์
โข mapred.jobtracker.taskScheduler
โข mapred.reduce.parallel.copies
โข mapred.reduce.tasks
โข tasktracker.http.threads
โข mapred.reduce.slowstart.completed.maps
- 40.
40 9/27/2013
โข HDFS๋ธ๋ก ์ฌ๋ณธ์ ์๋ก ๋ค๋ฅธ ๋จธ์ ์ ์ ์ฅ
> ํ์ง๋ง, ์์น ์ ๋ณด๊ฐ ์๋ค๋ฉด ํ๋์ ๋์ ๋ชจ๋ ์ ์ฅ ๊ฐ๋ฅ์ฑ์ด ์์
> ๋ ์ ์ฒด๊ฐ ์คํจํ ๊ฒฝ์ฐ ๊ฐ์ฉ์ฑ ๋ฌธ์ ๋ฐ์
โข ์ฒซ ๋ฒ์งธ ๋ณต์ ์ ์ฅ์๋ ์์๋ก ๊ฒฐ์
โข ๋ ๋ฒ์งธ, ์ธ ๋ฒ์งธ ๋ณต์ ์ ์ฅ์๋ ๋ค๋ฅธ ๋์ ๋ ๋จธ์ ์ ์ฅ
> 3๊ฐ์ ๋์ ์ ์ฅํ์ง ์๋ ์ด์ ๋ ๋จธ์ ์ ์คํจ๋ณด๋ค ๋์ ์คํจ๊ฐ ์ ๋ค.
> ๋ ๋ฒ์งธ, ์ธ ๋ฒ์งธ ๋์ผ ๋ ๋ด์ ๋จธ์ ์ ๋ฐฐ์นํ๋ฉด ๋ฐ์ดํฐ ๊ตํ ์ ์ฌ์
โ ๋ ์ค์์น๋ง ๊ฑฐ์น๊ฒ ๋๋๊น.
โข ์คํฌ๋ฆฝํธ๋ก ์์ฑํ์ฌ Configuration ์ค์
Rack Topology
- 41.
41 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 42.
42 9/27/2013
โข ๋๊ฐKerberos ์ฌ์ฉ
> ์ฃผ์ฒด, ์ธ์คํฐ์ค ์์ญ์ ์ธ ๊ฐ์ง ์ปดํฌ๋ํธ
> Kerberos ์์ฒด๋ง์ผ๋ก ํ์ตํด์ผ ํ๋ฉฐ, Learning Curve ์๋นํ ํผ
> ๋ฐ๋ผ์, ์์คํ
๊ด๋ฆฌ์/์ด์์์ ํจ๊ป
> ์คํ๋ ค ํ๋ก์ core-site.xml/mapred-site.xml ์ค์ ํ์ผ๋ง ์์ ํ๋ฉด
๋
์๋ณ, ์ธ์ฆ, ํ๊ฐ
name value
hadoop.security.authentication Kerberos
hadoop.securitY.authorization true
dfs.namenode.keytab.file
dfs.datanode.keytab.file
/etc/hadoop/conf/hdfs.keytab
dfs.block.access.token
dfs.namenode.kerberos.principal
dfs.namenode.kerberos.https.principal
dfs.datanode.kerberos.principal
dfs.datanode.kerberos.https.principal
host/ _HOST@MYREALM.MYCOMPANY.COM
dfs.https.address
dfs.datanode.http.address
0.0.0.0
0.0.0.0:1006
dfs.https.port 50470
dfs.datanode.address 0.0.0.0:1004
dfs.datanode.data.dir.perm 0700
- 43.
43 9/27/2013
โข ๋ค๋ฅธ์์ฝ์์คํ
๊ณผ ๊ถํ/์ธ์ฆ/ํ๊ฐ ์ค์ ์ ํด์ผ ํจ
โข ์์ ํ๊ฑฐ๋ ์๋๊ฑฐ๋!
> ๋ฐ์ดํฐ๋ ์์คํ๋ค. ๋ฐ๋ผ์ ์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ ์ผํฐ ๋ด์์๋ TOP Level
์์น
> ๊ธฐ์
๋ด SOC(Security Official Center) ์ด์
โ ์ฌ! ์ธํฐ๋ท, ํด๋ํฐ๋ ์ด์ฉ๋์ง ์์
โ ๋ฐ๋ผ์ ๊ฐ๋ฐ Cluster์ ๊ตฌ๋ถ๋์ด์ผ ํจ
โ Hadoop Client ์ฐ๊ฒฐ๋๋ ๋
ธ๋๊ฐ ํ์๋ก ํ์ํจ
โข ์๋๋ฉด, ์๋ฒฝํ ๋ณด์ ๊ฐ์ด๋ ์ค์
> ํ์ง๋ง, ๋ณด์ ๋ ๋ฒจ์ด ๋์์๋ก ์ฑ๋ฅ์ ์ ํ ๋จ
> ๋ฐ์ดํฐ ์ํธํ
โ ๋์ฝ๋ฉ ๋ ๋ฒจ์ ํ๋ก์์ ํ ๊ฒ์ธ๊ฐ? ์๋๋ฉด ์ธ๋ถ ์๋ฒ์์ ํ ๊ฒ์ธ๊ฐ?
โ ๋๊ฒ ํ๋ก์์๋ ํ์ง ์์ ๏ ๋์ฝ๋ฉ ์์ฒด๊ฐ ๊ทน์ฌํ IO ๋ฌธ์ ๋ฅผ ๋ฐ์ํจ
Hadoop Security Planning
- 44.
44 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 45.
45 9/27/2013
โข ๋๋ ํฐ๋ฆฌํธ๋ฆฌ ๊ตฌ์กฐ ํ์ฉ์ผ๋ก ์ฌ์ฉ์๋ค์์ธ ์ฟผํฐ ๋ถ์ฌ
# hadoop dfsadmin โsetSpaceQuota 10737418240 /user/joel
# hadoop fs โcount โq /user/joel
HDFS ์ฟผํฐ
/
--data/
----user-activity/
----syslog/
----purchase/ # ์ฟผํฐ ์ ํ ์์
--group/
----ps/ #์ฟผํฐ 100TB
--users/ #์ฌ์ฉ์ ์ฟผํฐ 1TB
----joel/
----ryan/
----simon/
- 46.
46 9/27/2013
MapReduce Scheduler
โขFIFO ์ค์ผ์ค๋ฌ
> ๋จผ์ ์ค๋ฉด ๋จผ์ ์ฒ๋ฆฌ
> ๋
์ ๋ฌธ์ ๋ฐ์
> ์ฐ์ ์์ ์ง์
โ ๋งค์ฐ ๋ฎ์ < ๋ฎ์ < ๋ณดํต < ๋์ < ๋งค์ฐ ๋์
> ์ํ, ์คํ์ฉ, ๊ฐ๋ฐ ํด๋ฌ์คํฐ์๋ง ์ ์ฉ
โข Fair ์ค์ผ์ค๋ฌ
> ํ์ ์ ์ถ๋ ์ก์ ํ ์ค ํ๋์ ๋ฐฐ์น
> ํด๋ฌ์คํฐ์ ์ด ์ฌ๋กฏ ์ฉ๋
> ๋ค๋ฅธ ํ์ ํ์ฌ ์์ฒญ, ์ต์ ๋ณด์ฅ ์ฌ๋กฏ, ๊ธฐ์ฉ ์ฌ๋กฏ ์ฉ๋ ๋ฑ์ผ๋ก ํ์คํฌ
์ฌ๋กฏ ์ ๊ฒฐ์
โข Capacity ์ค์ผ์ค๋ฌ
> ์ด ํด๋ฌ์คํฐ ์ฌ๋กฏ ์๋ฅผ ๊ฐ์ง ๋ค์์ ํ๋ฅผ ์ค์
> ํ์ ์์ฒญ์ด ์์ ๋๋ง ์์ฝ
- 47.
47 9/27/2013
Fair ์ค์ผ์ค๋ฌ์๊ณ ๋ฆฌ์ฆ ์ค๋ช
ํ ์์ฒญ ์ต์๋ถ
๋ฐฐ
์ค์ ๋ถ
๋ฐฐ
์กฐ์ 20 0 20
๋ผ์ด์ธ 40 0 40
์ด ์ฌ๋กฏ ์ฉ๋: 80
ํ ์์ฒญ ์ต์๋ถ
๋ฐฐ
์ค์ ๋ถ
๋ฐฐ
์กฐ์ 20 0 20
๋ผ์ด์ธ 40 0 30
์ธ์ด๋จผ 120 0 30
์ด ์ฌ๋กฏ ์ฉ๋: 80
ํ ์์ฒญ ์ต์๋ถ
๋ฐฐ
์ค์ ๋ถ
๋ฐฐ
์กฐ์ 40 0 25
๋ผ์ด์ธ 30 0 25
์ธ์ด๋จผ 30 50 30
์ด ์ฌ๋กฏ ์ฉ๋: 80
ํ ์์ฒญ ์ต์๋ถ
๋ฐฐ
์ค์ ๋ถ
๋ฐฐ
์กฐ์ 40 0 15
๋ผ์ด์ธ 30 0 15
์ธ์ด๋จผ 60 50 50
์ด ์ฌ๋กฏ ์ฉ๋: 80
ํ ์์ฒญ ๊ฐ์ค์น ์ค์ ๋ถ
๋ฐฐ
์กฐ์ 80 1 26
๋ผ์ด์ธ 60 2 53
์ด ์ฌ๋กฏ ์ฉ๋: 80
- 48.
- 49.
49 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 50.
50 9/27/2013
โข ํ๋ก์๋ชจ๋ ๋ฐ๋ชฌ์ Java ๋ฐ๋ชฌ
โข ์คํ ๊ณ์ ์ด ์ผ๋ฐ ๊ณ์ ์ผ๋ก ์คํ ํ๋ค๋ฉด
> # jps
โข ์คํ ๊ณ์ ์ด ์๋น์คํํ ์ฆ, root ์คํ ํ๋ค๋ฉด
> # ps โelf | grep java
> # ps โelf | grep โi namenode โฆ
โข ํ๋ก์ ํ๋ก์ธ์ค ์คํ
> # start-all.sh // ๋ค์๋
ธ๋, ๋ฐ์ดํฐ ๋
ธ๋, ์ก ํธ๋์ปค, ํ์คํธ
ํธ๋์ปค ์คํ
> # stop-all.sh // ๋ค์๋
ธ๋, ๋ฐ์ดํฐ ๋
ธ๋, ์ก ํธ๋์ปค, ํ์คํธ
ํธ๋์ปค ์ ์ง
> # start-dfs.sh // ๋ค์๋
ธ๋, ๋ฐ์ดํฐ ๋
ธ๋ ์คํ
> # stop-dfs.sh // ๋ค์๋
ธ๋, ๋ฐ์ดํฐ ๋
ธ๋ ์ ์ง
> # start-mapred.sh // ์ก ํธ๋์ปค, ํ์คํธ ํธ๋์ปค ์คํ
> # stop-mapred.sh // ์ก ํธ๋์ปค, ํ์คํธ ํธ๋์ปค ์ ์ง
> # hadoop-daemon.sh // ํ๋ก ๋
ธ๋ ๊ฐ๋ณ์ ์คํ
Hadoop Process ๊ด๋ฆฌ
- 51.
- 52.
52 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 53.
53 9/27/2013
โข ์ฑ๋ฅ๋ชจ๋ํฐ๋ง
> JVM, dfs, mapred
> Job status, Failed Job, Task ๊ฐ์
โข ์ํ ๋ชจ๋ํฐ๋ง
> CPU, Memory, Disk, Network Traffic
> Hadoop Daemon, Hadoop Log
โข ์์ฉ ํด์ ์ด์ฉํ๋ ๋ฐฉ๋ฒ
> ์๋นํ ๊ณ ๊ฐ
โข ์ผ๋ฐ์ ์ธ ์คํ์์ค ํ์ฉ
> Ganglia + Nagios + Ambari(Hadoop Ecosystem)
Monitoring
- 54.
54 9/27/2013
โข ๋ฐ์ดํฐ๋ฐฑ์
> ๋ถ์ฐ ๋ณต์ (distcp)
> ๋ณ๋ ฌ ๋ฐ์ดํฐ ์์ง์ ๋ฐ๋ก ๋ฐ์ดํฐ ์ด์คํ
โ Apache Flume ์ด์ฉํ์ฌ HDFS ์ฑํฌ๋ก ํตํด Direct ์ ์ฅ
โข ๋ฉํ ๋ฐ์ดํฐ ๋ฐฑ์
> ๋ด์ฅ ์น์๋ฒ /getimage ์๋ธ๋ฆฟ ํธ์ถ
> getimage=1, fsimage ์ถ์ถ
# curl โo fsimage.201309 โhttp://centos1:50070/getimage?getimage=1โ
> getedit=1, edits ์ถ์ถ
# curl โo fsimage.201309 โhttp://centos1:50070/getimage?getedits=1โ
Backup and Recovery
Hadoop Cluster 1
Hadoop Cluster 2
Flume
sink
Data source
๋์ ์ ์ฅ
- 55.
55 9/27/2013
โข ๊ธฐ๋ณธ์ฌ์ฉ ๋ฐฉ๋ฒ
# hadoop distcp hdfs://centos1:50030/path/one hdfs://remote:50030/path/two
> -m: ๋งคํผ์ ์ ์ด
> -overwrite: ๊ธฐ์กดํ์ผ ๋ฎ์ด์ฐ๊ธฐ
> -update: ๋ณ๊ฒฝ๋ ๋ถ๋ถ๋ง ๋ณต์ฌ
> -delete: ์๋ณธ์๋ ์๊ณ ๋ชฉ์ ์ง์ ์๋ ํ์ผ ์ญ์
โข ๊ธฐ๋ณธ ๋์ข
ํด๋ฌ์คํฐ
> hdfs://
โข ์ด๊ธฐ์ข
ํด๋ฌ์คํฐ
> webhdfs://
> httpfs://
โข Amazon S3 ์ง์
> s3://
๋ถ์ฐ๋ณต์ Distcp
- 56.
56 9/27/2013
1. HadoopIntroduction
2. Hadoop Distributed File System
3. Hadoop MapReduce
4. Hadoop Cluster Planning
5. Hadoop Installation and Configuration
6. Hadoop Security
7. Hadoop Resource Management
8. Hadoop Cluster Management
9. Hadoop Monitoring, Backup and Recovery
10. Hadoop NG; Glance at YARN
CONTENTS
- 57.
- 58.
58 9/27/2013
YARN
โข ResourceManager
> Job Tracker์ ์์ ๊ด๋ฆฌ
> ํด๋ฌ์คํฐ ๋ชจ๋ํฐ๋ง
โข Node Manager
> Task Tracker ์ญํ
โ Map๊ณผ Reduce ๊ด๋ฆฌ
> ์ค์ง์ MapReduce ์ํ
โข Application Master
> ๋จ์ผ Job Tracker๊ฐ ์๋
Editor's Notes
- #7ย Velocity: Batch, Near Real-time, Real-time, StreamVolume: Terabytes, Records, Transaction, Table, fileVariety: ์ ํ, ๋ฐ์ ํ, ๋น์ ํ๋ชจ๋ ๋ฐ์ดํฐComplex: IT ์ตํฉ
- #8ย ๋งต๊ณผ ๋ฆฌ๋์ค๋ LISP ์ฝ๋์์ ์ ๋,FunctionalityProgramming์ ํ๋ก๊ทธ๋๋ฐ ๋ชจ๋ธ,Map๊ณผ Reduce๊ทธ๋์ ์ด๋ค ์ธ์ด๋ก๋ ๊ฐ๋ฅํ์ง๋ง,Functional Language์ ์ ํฉ์๋ฐ๋ ๋ณ์ข
Map + Reduce๏จ ๊ตฌ๊ธ GFS ๋ฐํ ์ดํ ๋
ผ๋ฌธ์์ ๊ณต๊ฐ ๋๊ทธ ์ปคํ
์ด ์๋ฐ๋ก ๊ฐ๋ฐ
- #14ย ๊ฐ์ธ์ ์ผ๋ก ์ต์
์ ์ด๋ฆ์ด์ง ์์๋ ์ถ๋ค. ๋ค์๋
ธ๋๊ฐ ์ฃฝ์ด๋ ๋ณด์กฐ ๋ค์๋
ธ๋ ๋๋ฌธ์ ํด๋ฌ์คํฐ๊ฐ ๋์์ผ๋ก ์ํํ๋ค๊ณ ๋ฏฟ๊ณ ์๋ค.
- #16ย ํ๋ก 0.15๋ถํฐ ์์ค ๋ถ์, ์ด๊ธฐ๋ฒ์ ์์ HDFSํ๋ก 0.19๋ฒ์ MapReduce ๋ฒ์ ๋ถ์ํ์ง๋ง, ๋ฒ์ ๋ณ๋ก ๋๋ฌด ํ๋ค์๋ค.
- #17ย fsimage์ edits ํ์ผ์ด ๋งค์ฐ ์ค์,fsimage๋ ํ์ผ์์คํ
์ ๋ฉํ๋ฐ์ดํฐ ์ค๋
์ท์ด๊ณ ,edits ๋ฉํ๋ฐ์ดํฐ์ ๋์ ๋ ๋ณ๊ฒฝ ๋ด์ฉedits ํ์ผ์ WAL๋ก ์ง์์ ์ธ ํ์ผ ์ถ๊ฐ์กฐ์์ ํ๋ฏ๋ก I/O ์์
์ ๋ถํ๋ ์ ๊ณ , ์ฑ๋ฅ์ ํดํ๋ ํ์๋ ์กฐ์ ๊ฐ๋ฅ, ํ์ง๋ง ์๊ฐ์ด ์ง๋ ์๋ก ์ปค์ง๊ฒ ๋๋ฏ๋ก fsimage์ ๋ฐ์์ด๋ฐ ์ผ์ ํ๊ธฐ์๋ ํด๋ผ์ด์ธํธ์ ํด๋ฌ์คํฐ ์์ฒญ ์ฒ๋ฆฌ๋ ํด์ผ ํจ. ๋ฐ๋ผ์ ๋ณด์กฐ ๋ค์๋
ธ๋๊ฐ ํ์ํ๊ฒ ๋จ.1 ๋ณด์กฐ ๋ค์๋
ธ๋๋ ๋ค์๋
ธ๋์๊ฒ edits ํ์ผ์ ๋ณด๊ดํ๊ณ edits.new ํ์ผ์ ๋ก๊ทธ๋ฅผ ์ฐ๋ผ๊ณ ์ง์ํ๋ค.2 ๋ณด์กฐ ๋ค์๋
ธ๋๋ ๋ค์๋
ธ๋์ fsimage์ edits ํ์ผ์ ๋ก๊ฑธ ์ฒ|ํฌํฌ์ธํธ checkpoint ๋๋ ํฐ๋ฆฌ๋ก ๋ณต์ฌํ๋ค.3 ๋ณด์กฐ ๋ค์๋
ธ๋๋ fsimage๋ฅผ ๋ก๋ํ๊ณ edits๋ฅผ ์์์๋ถํฐ ๋ฐ์ํ์ฌ ์๋ก์ด ํ์ผ์ ๋ง๋ ํ fsimage๋ฅผ ๋์คํฌ์ ์ ์ฅํ๋ค.4 ๋ณด์กฐ ๋ค์๋
ธ๋๋ ์ fsimage๋ฅผ ๋ค์๋
ธ๋์ ๋ณด๋ด๊ณ ๊ทธ๊ฒ์ ๋ฐ๋ก ์ ์ฉํ๋๋ก ์ง์ํ๋ค.5 ๋ค์๋
ธ๋๋ edits.new ํ์ผ์ ์ด๋ฆ์ edits๋ก ๋ณ๊ฒฝํ๋ค
- #18ย ๋ฆฌ๋
์ค HA๋ ์ฌ์ฉํ์ง ์๋ ์ด์ ๋ ๋ฆฌ๋
์ค-HA๋ ์ ์ ์ปจํ
์ธ ๋ฅผ ์ ๊ณตํ๋ ๋ฌด์ํ ์๋น์ค์ ์ ํฉํ๊ณ ๋ค์๋
ธ๋๋ ๊ฐ์ ์ํ-๊ธฐ๋ฐ ์์คํ
์๋ ๋ง์ง ์๋ค. ๋ํ ๊ฐ์ IP์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๋ฆฌ๋
์ค HA ์ ํฉํ์ง ์์
- #31ย ํ๋ก์ธ์ค๋ฅผ ์์ํ๊ฑฐ๋ fork () ํจ์๋ฅผ ํธ์ถํ๋ฉด ์ ์ฒด ํ์ด์ง ํ
์ด๋ธ์ด ๋ณต์ ๋๋ค. ๋ค๋ฅธ ๋ง๋กํ๋ฉด,์์ ํ๋ก์ธ์ค๋ ๋ถ๋ชจ ํ๋ก์ธ์ค ๋ฉ๋ชจ๋ฆฌ์ ์์ ํ ์ฌ๋ณธ์ ์ ์ฅํ๋ฏ๋ก ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ ๋ฐฐ ํ์ํ๋ค. ๋ํ์์ ํ๋ก์ธ์ค๊ฐ exec() ํ์๋ฅผํตํด ๋ถ๋ชจ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ณต์ฌํ๋ ์๊ฐ๋ ๋ญ๋น๋๋ค. ๊ทธ๋ฐ๋ฐ fork ()์ ํธ์ถ์ด ๋๋ฌด ๋น๋ฒํ์ฌ ๋ถ๋ชจ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ณต์ฌํ์ง ์๋ vfork () ํ์๊ฐ ํ์ํ๊ฒ ๋์๋ค. ๋ค๋ฅธ ๋ง๋ก ํ๋ฉด๏ผ์์ ํ๋ก์ธ์ค๊ฐ ์ง์ exec() ํจ์๋ฅผ ํธ์ถํ ๋๊น์ง ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ณต์ฌํ์ง ์๋๋ค. ์นจ๊ณ ๋ก HotSpot ]VM์ vfork () ํจ์๊ฐ ์๋ fork ()๋ก ์๋ฐ์ fork ์กฐ์์ ๊ตฌํํ์ผ๋ฏ๋ก ๋ฌธ์ ๊ฐ ์๋ค.์ด๊ฒ์ด ์ ํ๋ก์ ๋ฌธ์ ๊ฐ ๋ ๊น? ํ๋ก ์คํธ๋ฆฌ๋ฐ (๋ค๋ฅธ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์์ ๊ธฐ๋ณธ ์
๋ ฅ๊ณผ ์ถ๋ ฅ์ผ๋ก ๋ฉ๋ฆฌ๋์ค ์ก์ ์คํํ๋๋ก ์ง์ํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ)์ ์ฌ์ฉ์ ์ฝ๋๋ฅผ ์์ํ ๋์์ ํ๋ก์ธ ์ค๋ฅผ ์์ฑ์ํค๊ณ ํ์ดํ๋ผ์ธ์ ๊ฒฝ์ ํด ๋ฐ์ดํฐ๋ฅผ ์ฃผ๊ณ ๋ฐ๋๋ค. ๋ฐ๋ผ์ ์์ ํ์คํฌ๋ฅผ ์ํด ์ถ๊ฐ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํผ์ํ๋ค. ๋ํ ํ๋ก์ธ์ค๊ฐ ์์๋ ๋ ์๊ฐ๋ ๋ญ๋น๋์ง๋ง๏ผ ์ฐ๋ฆฌ๊ฐ ์์ํ๋ ๋๋ก ๋ฉ๋ชจ๋ฆฌ๋ ๋ ๋ฐฐ ์์ฉํ๋ค. ์ด๋ฐ ์ด์ ๋ก vm. overcommlt_memroy๋ฅผ 1 ๋ก ์ค์ ํด์ผํ๋ฉฐ, ์ด์๊ด๋ จ๋ vm.overcommit_ratio๋์ ํํ ์ค์ ํด์ผํ๋ค.
- #33ย 48x 12 =576
- #37ย โข hadoop-env.shํ๋ก ์คํฌ๋ฆฝํธ๋ ๋ณธbourne์
๋ก ์์ฑ๋๋ฉฐ๏ผ ์ด ํ์ผ์ ํ๋ก์ ํ์ํ JDK. JDK ๋ฐ๋ชฌ์ ์ต์
.P ID ํ์ผ๏ผ ๋ก๊ทธํ์ผ์ ๋๋ ํฐ๋ฆฌ ๋ฑ ํ๊ฒฝ ๋ณ์๋ค์ ์ง์ ํจ๋ผ ์ด ๋ณ์๋ค์ 1 20ํ์ด์ง โํ๊ฒฝ ๋ณ์์ ์
์คํฌ๋ฆฝํธโ์์ ์ค์ํจtcf .โข core-site.xml๋ชจ๋ ํ๋ก ๋ฐ๋ชฌ๊ณผํด๋ผ์ด์ธํธ์ ๊ด๋ จ๋ ๋ฐ๋ผ๋ฏธํฐ๋ฅผ ์ง์ ํ XML ํ์ผ์ด๋คโข hdfs-site.xmlHDFS ๋ฐ๋ชฌ๊ณผํด๋ผ์ด์ธํธ์ ํ์ํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ง์ ํ XML ํ์ผ์ด๋คโข mapred -site.xml์
๋ฆฌ๋์ค ๋ฐ๋ชฌ๋ค๊ณผํด๋ผ์ด์ธํธ์ ํ์ํ ๋ฐ๋ผ๋ฏธํฐ๋ฅผ ์ง์ ํ XML ํ์ผ์ด๋ค .โข log4j.properties๋ชจ๋ ๋ก๊ทธ ์ค์ ์ ๋ณด๋ฅผ ํฌํจํ ์ง๋ฐ ์์ฑ ํ์ผ์ด๋ค ์ด ์์ฑ๋ค์ 1 23ํ์ด์ง โ๋ก๊ทธ ์ค์ โ์์ ์ค๋ช
ํจH๊ฐ .โข masters (์ต์ )๋ณด์กฐ ๋ค์๋
ธ๋๊ฐ ์คํ๋๋ ๋จธ์ ๋ค์ ๋ชฉ๋ก์ผ๋ก ํ ์ค์ ํ๋์ฉ ๋ฑ๋ก๋๋ค. ์ด ํ์ผ์ start-*.shํ์์ ๋ณด์กฐ์คํฌ๋ฆฝํธ์์์ฌ์ฉํจ๋ดโข slaves (์ต์
)๋ฐ์ดํฐ๋
ธ๋lํ์คํฌํธ๋์ปค ~fQ l ์คํ๋๋ ๋จธ์ ํ์ ๋ชฉ๋ก์ผ๋ก ํ ์ค์ ํ๋์ฉ ๋ฑ๋กํจฮบt์ด ํ์ผ์ staฮท- *.shํ์์ ๋ณด์กฐ ์คํฌ๋ฆฝํธ์์ ์ฌ์ฉํจ๋ผ .โข fair-scheduler.xml (์ต์
)์
๋ฆฌ๋์ค์ ํ์คํฌ ์ค์ผ์ค๋ฌ ํ๋ฌ๊ทธ์ธ ์ค ํ์ด ์ค์ผ์ค๋ฌFair Scheduler์ผ| ์์ ํ๊ณผ ์ค์ ์ ์ ์ํ ํ์ผ์ด๋คโข capacity-scheduler.xml (์ต์
)์
๋ฆฌ๋์ค์ ํ์คํฌ ์ค์ผ์ค๋ฌ ํ๋ฌ๊ทธ์ธ ์ค ์ผ๋ ์ํฐ ์ค์ผ์ค๋ฌCapacity Scheduler์ ํ์ ์ค์ ์ ์ ์ํ ํ์ผ์ด๋คโข dfs.include (์ต์
๏ผ ๊ด์ฉ๋ช
)๋ค์๋
ธ๋ ์ ์์ ํ์ฉํ ๋จธ์ ๋ค์ ๋ชฉ๋ก์ผ๋ก ํ ์ค์ ํ๋์ฉ ๋ฑ๋กํtcf .โข dfs.exclude(์ต์ ๏ผ ๊ด์ฉ๋ช
)๋ค์๋
ธ๋ ์ ์์ ํ์ฉํ์ง ์์ ๋จธ์ ๋ค์ ๋ชฉ๋ก์ผ๋ก ํ์ค์ด| ํ๋์ฉ ๋ฑ๋กํ๋ค .โข hadoop-policy.xmlํ๋ก๊ณผ ํต์ ํ ๋ ํน์ RPC ํ ์์ ํธ์ถ์ ํ์ฉํ ๊ณ์ ๋๋ ๊ทธ๋ฃน์ ์ง์ ํ XML ๋ฐ์ผ์ด๋คโข mapred-queue - acls.xml์
๋ฆฌ๋์ค ์ก ํ์ ์ก์ ์ |์ถ์ด ํ์ฉ๋ ๊ณ์ ๋๋ ๊ทธ๋ฃน์ ์ง์ ํ XML ํ์ผ์ด๋คโข taskCtrller.cfg๋ณด์ ๋ชจ๋๋ก ์คํํ ๋ ์
๋ฆฌ๋์ค ๋ณด์กฐ ํ๋ก๊ทธ๋จ์ธ setuidํ์คํฌ ์ปจํธ๋กค๋ฌ์ ํ์ํ ๊ฐ์ ์ง์ ํ ์๋ฐ ์์ฑํ์์ํ์ผ์ด๋ค.
- #40ย CPU ์ฝ์ด ๊ฐ์๊ฐ 12์ด๋ฉด x 1.5๋ฅผ ์ํ ๏จ 18๊ฐ2/3๋ ๋งตํ์คํธ,1/3์ ๋ฆฌ๋์คํ์คํฌ