0% found this document useful (0 votes)

82 views5 pages

Hadoop Cluster Setup on EC2 Guide

This document provides steps to install Hadoop cluster on an EC2 Ubuntu instance for educational purposes. It involves installing Java 8, openssh server, downloading Hadoop files and configuring core-site.xml, yarn-site.xml, mapred-site.xml and hdfs-site.xml files. Directories are created for datanode, namenode and permissions set. Hadoop is started using start-dfs.sh and start-yarn.sh scripts. The status of daemons can be verified using jps command and Hadoop UI accessed via ports 8088 and 50070.

Uploaded by

Vidhyasagar B S Naidu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as RTF, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

82 views5 pages

Hadoop Cluster Setup on EC2 Guide

Uploaded by

Vidhyasagar B S Naidu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as RTF, PDF, TXT or read online on Scribd

You are on page 1/ 5

SRM INSTITUTE OF SCIENCE AND TECHNOLOGY: VADAPALANI CAMPUS

DEPARTMENT OF COMPUTER SCIENCE AND ENGINEEERING

Prerequisite

ubuntu 16.04

Make ec2 as password Authentication:

use command for setting password to ec2 ubuntu image: sudo passwd ubuntu

Step:1 JAVA 8-----

1. sudo add-apt-repository ppa:webupd8team/java

2. sudo apt-get update
3. sudo apt-get install oracle-java8-installer
4. sudo apt-get install oracle-java8-set-default

Step 2: SSH SERVER INSTALLATION

5. sudo apt-get install openssh-server

6. sudo sed -i -e 's/PasswordAuthentication no/PasswordAuthentication yes/g'

/etc/ssh/sshd_config

7. ssh-keygen -t dsa -P “” -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

8. sudo service ssh restart

9. ssh localhost
//passwordless login
10. exit

Step 3: Download hadoop package

https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz

10 .wget https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-
2.7.3.tar.gz

11. sudo tar -xzvf hadoop-2.7.3.tar.gz

sudo mkdir -p /usr/local/hadoop

sudo mv hadoop-2.7.3/* /usr/local/hadoop/

12. sudo chown -R ubuntu:ubuntu /usr/local/hadoop

//create folder for datanode and name node

13sudo mkdir -p /app/hadoop/tmp

14 sudo mkdir -p /app/hadoop/tmp

set permission

15 sudo chown -R ubuntu /app/hadoop/tmp

Step 4: Configure Hadoop:

 Check where your Java is installed:
 16 readlink -f /usr/bin/java

If you get something like /usr/lib/jvm/java-8-oracle/jre/bin/java,

/usr/lib/jvm/java-8-oracle is what you should used for JAVA_HOME.

 Add to ~/.bashrc file:

17 sudo nano ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/java-8-oracle
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib/native"

 Reload ~/.bashrc file:

18 source ~/.bashrc
 Modify JAVA_HOME in

19 sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

 Modify
20. sudo nano /usr/local/hadoop/etc/hadoop/core-site.xml

to have something like:

<configuration>
...
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>

<name>hadoop.tmp.dir</name>

<value>/app/hadoop/tmp</value>

<description>A base for other temporary directories.</description>

</property>

...
</configuration>

 Modify
21. sudo nano /usr/local/hadoop/etc/hadoop/yarn-site.xml

to have something like:

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8025</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:8030</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8040</value>
</property>

 Create /usr/local/lib/hadoop-2.7.0/etc/hadoop/mapred-site.xml
from template:

21. cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template
/usr/local/hadoop/etc/hadoop/mapred-site.xml

 Modify
22. sudo nano /usr/local/hadoop/etc/hadoop/mapred-site.xml

to have something like:

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

 Modify
23. sudo nano /usr/local/hadoop/etc/hadoop/hdfs-site.xml

to have something like:

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

</configuration>

 Format file system:

24. hdfs namenode -format

 Start Hadoop:
25. start-dfs.sh
26. start-yarn.sh
You might be asked to accept machine’s key.
 Check if everything is running:
27. jps

You should get something like:

Jps
NodeManager
NameNode
ResourceManager
DataNode
SecondaryNameNode

TYPE IN WEB BROWSER

28. http://localhost:8088/cluster
29. http://localhost:50070/

INSTALLED HADOOP CLUSTER SUCCESSFULLY IN AMAZON EC2

Hadoop Installation On Linux
No ratings yet
Hadoop Installation On Linux
4 pages
Single Node Hadoop Cluster
No ratings yet
Single Node Hadoop Cluster
9 pages
Updated CMD
No ratings yet
Updated CMD
23 pages
Install Hadoop on Ubuntu Guide
No ratings yet
Install Hadoop on Ubuntu Guide
3 pages
Hadoop Installation Steps in Ubuntu-By-Ahmed
No ratings yet
Hadoop Installation Steps in Ubuntu-By-Ahmed
4 pages
Exp 1 Hadoop Installation Steps
No ratings yet
Exp 1 Hadoop Installation Steps
4 pages
BDA Practical1 MC18-23
No ratings yet
BDA Practical1 MC18-23
17 pages
Install Single Node Hadoop on Ubuntu
No ratings yet
Install Single Node Hadoop on Ubuntu
13 pages
Bdamanual
No ratings yet
Bdamanual
8 pages
Hadoop Installation Steps
100% (1)
Hadoop Installation Steps
6 pages
Hadoop 2 - Pseudo Node Installation
No ratings yet
Hadoop 2 - Pseudo Node Installation
9 pages
Support of Hadoop Cluster Installation and Administration
No ratings yet
Support of Hadoop Cluster Installation and Administration
10 pages
Big Data Analytics - Lab-Manual
No ratings yet
Big Data Analytics - Lab-Manual
19 pages
BDA Practical
No ratings yet
BDA Practical
38 pages
Installationof Hadoop 3
No ratings yet
Installationof Hadoop 3
6 pages
Installing A Single Node Hadoop Cluster
No ratings yet
Installing A Single Node Hadoop Cluster
4 pages
Hadoop
No ratings yet
Hadoop
5 pages
Step 1 - Install Oracle Java 8 On Ubuntu
No ratings yet
Step 1 - Install Oracle Java 8 On Ubuntu
7 pages
Hadoop Setup Guide for Beginners
No ratings yet
Hadoop Setup Guide for Beginners
14 pages
Single Node Cluster Creation in AWS Educate EC2
No ratings yet
Single Node Cluster Creation in AWS Educate EC2
4 pages
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster)
No ratings yet
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster)
27 pages
Hadoop Installation Step by Step
No ratings yet
Hadoop Installation Step by Step
8 pages
Installation of Hadoop in Ubuntu
No ratings yet
Installation of Hadoop in Ubuntu
15 pages
Online:: Setting Up The Environment
No ratings yet
Online:: Setting Up The Environment
9 pages
Hadoop Cluster Creation
No ratings yet
Hadoop Cluster Creation
8 pages
Hadoop
No ratings yet
Hadoop
4 pages
Hadoop Setup Guide for Linux Users
No ratings yet
Hadoop Setup Guide for Linux Users
23 pages
$ Sudo Apt-Get Install Oracle-Java8-Installer
No ratings yet
$ Sudo Apt-Get Install Oracle-Java8-Installer
4 pages
Hadoop 2.6.5 Installing On Ubuntu 16.04 and 18.04 (Single-Node Cluster)
No ratings yet
Hadoop 2.6.5 Installing On Ubuntu 16.04 and 18.04 (Single-Node Cluster)
7 pages
PRACTICAL 4 - Single and Multi Node Hadoop Install
No ratings yet
PRACTICAL 4 - Single and Multi Node Hadoop Install
11 pages
Hadoop Installation Final
No ratings yet
Hadoop Installation Final
32 pages
Installation of Hadoop On Ubuntu-Pseudo Distributed Mode
No ratings yet
Installation of Hadoop On Ubuntu-Pseudo Distributed Mode
3 pages
Big Data
No ratings yet
Big Data
5 pages
DataVisuaization Lab
No ratings yet
DataVisuaization Lab
5 pages
Hadoop Installation Commands
No ratings yet
Hadoop Installation Commands
3 pages
Bda Lab Manual
No ratings yet
Bda Lab Manual
45 pages
Hadoop Installation
No ratings yet
Hadoop Installation
5 pages
Hadoop Single Node Installation
No ratings yet
Hadoop Single Node Installation
7 pages
Hadoop 3 Installation
No ratings yet
Hadoop 3 Installation
10 pages
Hadoop Install
No ratings yet
Hadoop Install
19 pages
Bda Lab
No ratings yet
Bda Lab
37 pages
CC 7
No ratings yet
CC 7
7 pages
Hadoop Setup Guide for Developers
No ratings yet
Hadoop Setup Guide for Developers
3 pages
Hadoop Installation
No ratings yet
Hadoop Installation
7 pages
Installing Standalone and Pseudocode Hadoop Cluster: 1. Setting Up Vmware Virtual Machine
No ratings yet
Installing Standalone and Pseudocode Hadoop Cluster: 1. Setting Up Vmware Virtual Machine
14 pages
HADOOP 1.X Installation Steps On Ubuntu
No ratings yet
HADOOP 1.X Installation Steps On Ubuntu
3 pages
Week 1 Lab
No ratings yet
Week 1 Lab
8 pages
Hadoop 2.7.3 Setup On Ubuntu 15.10
No ratings yet
Hadoop 2.7.3 Setup On Ubuntu 15.10
7 pages
Hadoop Installation
No ratings yet
Hadoop Installation
6 pages
Hadoop Setup Guide for Ubuntu 16.04/18.04
No ratings yet
Hadoop Setup Guide for Ubuntu 16.04/18.04
20 pages
Java-Hadoop 2.X Setting Up
No ratings yet
Java-Hadoop 2.X Setting Up
12 pages
CP5261Data Analytics Laboratory
No ratings yet
CP5261Data Analytics Laboratory
57 pages
Big Data Analytics Lab Manual
No ratings yet
Big Data Analytics Lab Manual
80 pages
Anurag 1-6 Merged
No ratings yet
Anurag 1-6 Merged
60 pages
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster) STEP:1
No ratings yet
Hadoop 2.6 Installing On Ubuntu 14.04 (Single-Node Cluster) STEP:1
13 pages
Single Node Cluster
No ratings yet
Single Node Cluster
31 pages
BDA Lab Manual
No ratings yet
BDA Lab Manual
49 pages
BDA Lab Manual UPDATED
No ratings yet
BDA Lab Manual UPDATED
45 pages
Original
No ratings yet
Original
17 pages
Robot Framework Introduction: Test Automation
No ratings yet
Robot Framework Introduction: Test Automation
29 pages
Jntuk r20 B.tech Cse 3-2 Cns Unit 3 Notes - 2
No ratings yet
Jntuk r20 B.tech Cse 3-2 Cns Unit 3 Notes - 2
26 pages
Anti Detect
100% (2)
Anti Detect
10 pages
4300A Handbook Attachment Q2 Mobile Devices 2014
No ratings yet
4300A Handbook Attachment Q2 Mobile Devices 2014
25 pages
Mikrotik Security: The Forgotten Things: Michael Takeuchi
No ratings yet
Mikrotik Security: The Forgotten Things: Michael Takeuchi
40 pages
Linux Banana Cheatsheet
No ratings yet
Linux Banana Cheatsheet
2 pages
Awesome Console Services List
No ratings yet
Awesome Console Services List
3 pages
Tableau Server Enterprise Deployment Guide
No ratings yet
Tableau Server Enterprise Deployment Guide
174 pages
11.2.4.5 Packet Tracer - Configuring Secure Passwords and SSH PDF
No ratings yet
11.2.4.5 Packet Tracer - Configuring Secure Passwords and SSH PDF
2 pages
ENIQ Storage Expansion
No ratings yet
ENIQ Storage Expansion
6 pages
SshOcean - Create Your Own SSH USA-01 Account in United States
No ratings yet
SshOcean - Create Your Own SSH USA-01 Account in United States
5 pages
NOC Runbook Special PDF
100% (1)
NOC Runbook Special PDF
419 pages
SSH Guide for IT Students
No ratings yet
SSH Guide for IT Students
20 pages
16.3.12 Lab - Examining Telnet and SSH in Wireshark
No ratings yet
16.3.12 Lab - Examining Telnet and SSH in Wireshark
4 pages
Pexpect Tutorial
No ratings yet
Pexpect Tutorial
143 pages
IT Model Exam With Brief Answers
No ratings yet
IT Model Exam With Brief Answers
98 pages
RSA Authentication Agent 7.1 For PAM-Installation and Configuration Guide For RHEL
No ratings yet
RSA Authentication Agent 7.1 For PAM-Installation and Configuration Guide For RHEL
23 pages
PowerScale OneFS HDFS Reference Guide OneFS 8.1.2.0 - 9.3.0.0
No ratings yet
PowerScale OneFS HDFS Reference Guide OneFS 8.1.2.0 - 9.3.0.0
48 pages
Fortigate Hardening Your Fortigate 56
No ratings yet
Fortigate Hardening Your Fortigate 56
12 pages
TCP/IP Protocol Suite Overview
No ratings yet
TCP/IP Protocol Suite Overview
16 pages
Applied Crypto Hardening
No ratings yet
Applied Crypto Hardening
95 pages
Ansible RAW Module Lab for Non-Python Devices
No ratings yet
Ansible RAW Module Lab for Non-Python Devices
20 pages
Tutor Debian 9
No ratings yet
Tutor Debian 9
20 pages
Using SSH Tunnels VNC RDP
No ratings yet
Using SSH Tunnels VNC RDP
13 pages
Top Android Apps For Hacking
67% (3)
Top Android Apps For Hacking
6 pages
Safeguard For Privileged Passwords - Administration Guide - 8.0
No ratings yet
Safeguard For Privileged Passwords - Administration Guide - 8.0
752 pages
FLOW-3D CAST Installation Guide
No ratings yet
FLOW-3D CAST Installation Guide
30 pages
Avaya SBCE Configuration For Recording Media Sessions SIP-REC
No ratings yet
Avaya SBCE Configuration For Recording Media Sessions SIP-REC
609 pages
TCP and UDP Port Numbers - Most Common Port Numbers
No ratings yet
TCP and UDP Port Numbers - Most Common Port Numbers
432 pages
Vision WFMRTACTI
No ratings yet
Vision WFMRTACTI
36 pages

Hadoop Cluster Setup on EC2 Guide

Uploaded by

Hadoop Cluster Setup on EC2 Guide

Uploaded by

SRM INSTITUTE OF SCIENCE AND TECHNOLOGY: VADAPALANI CAMPUS

DEPARTMENT OF COMPUTER SCIENCE AND ENGINEEERING

Make ec2 as password Authentication:

Step:1 JAVA 8-----

1. sudo add-apt-repository ppa:webupd8team/java

Step 2: SSH SERVER INSTALLATION

5. sudo apt-get install openssh-server

6. sudo sed -i -e 's/PasswordAuthentication no/PasswordAuthentication yes/g'

7. ssh-keygen -t dsa -P “” -f ~/.ssh/id_dsa

8. sudo service ssh restart

Step 3: Download hadoop package

11. sudo tar -xzvf hadoop-2.7.3.tar.gz

sudo mv hadoop-2.7.3/* /usr/local/hadoop/

12. sudo chown -R ubuntu:ubuntu /usr/local/hadoop

//create folder for datanode and name node

13sudo mkdir -p /app/hadoop/tmp

14 sudo mkdir -p /app/hadoop/tmp

15 sudo chown -R ubuntu /app/hadoop/tmp

Step 4: Configure Hadoop:

If you get something like /usr/lib/jvm/java-8-oracle/jre/bin/java,

/usr/lib/jvm/java-8-oracle is what you should used for JAVA_HOME.

 Add to ~/.bashrc file:

17 sudo nano ~/.bashrc

 Reload ~/.bashrc file:

19 sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh

to have something like:

<description>A base for other temporary directories.</description>

to have something like:

to have something like:

to have something like:

 Format file system:

You should get something like:

TYPE IN WEB BROWSER

INSTALLED HADOOP CLUSTER SUCCESSFULLY IN AMAZON EC2

You might also like