9 Practicas+BigData MapReduce

The document provides an overview of practicing MapReduce on Apasoft Training. It describes running a word count job on the text of Don Quixote stored in HDFS, viewing the results on the YARN application interface, and accessing log details of mappers and reducers.

Uploaded by

Fabian Forero

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

121 views6 pages

9 Practicas+BigData MapReduce

Uploaded by

Fabian Forero

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

Apasoft Training

Prácticas BigData
1. MapReduce
• Vamos a subir al directorio prácticas un fichero denominado “quijote.txt” que
contiene el Quijote. Lo tienes disponible en los recursos de las prácticas. Lo más
sencillo es que lo descargues desde la propia máquina virtual
hdfs dfs -put /home/hadoop/Descargas/quijote.txt /practicas
• NOTA IMPORTANTE: Aquellos que estáis usando Hadoop 3, es posible que
el siguiente ejemplo no funcione correctamente. En ese caso tenemos que añadir
al fichero yarn-site.xml el siguiente contenido. Por supuesto adaptarlo a vuestro
HADOOP_PATH
<property>
<name>yarn.application.classpath</name>
<value>
/opt/hadoop3/hadoop/etc/hadoop,
/opt/hadoop3/share/hadoop/common/*,
/opt/hadoop3/share/hadoop/common/lib/*,
/opt/hadoop3/share/hadoop/hdfs/*,
/opt/hadoop3/share/hadoop/hdfs/lib/*,
/opt/hadoop3/share/hadoop/mapreduce/*,
/opt/hadoop3/share/hadoop/mapreduce/lib/*,
/opt/hadoop3/share/hadoop/yarn/*,
/opt/hadoop3/share/hadoop/yarn/lib/*
</value>
</property>
• Lanzamos el wordcount contra el fichero. Indicamos el directorio de salida
donde dejar el resultado, en este caso en /practicas/resultado (siempre en HDFS)
hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-
examples-2.9.0.jar wordcount /practicas/quijote.txt /practicas/resultado
8/01/06 19:29:24 INFO Configuration.deprecation: session.id is deprecated.
Instead, use dfs.metrics.session-id
18/01/06 19:29:24 INFO jvm.JvmMetrics: Initializing JVM Metrics with
processName=JobTracker, sessionId=
18/01/06 19:29:26 INFO input.FileInputFormat: Total input files to process : 1
18/01/06 19:29:27 INFO mapreduce.JobSubmitter: number of splits:1
18/01/06 19:29:28 INFO mapreduce.JobSubmitter: Submitting tokens for job:
job_local382862986_0001
18/01/06 19:29:28 INFO mapreduce.Job: The url to track the job:
http://localhost:8080/
18/01/06 19:29:28 INFO mapreduce.Job: Running job:
job_local382862986_0001

www.apasoft-training.com 1
Apasoft Training

18/01/06 19:29:28 INFO mapred.LocalJobRunner: OutputCommitter set in

config null
18/01/06 19:29:28 INFO output.FileOutputCommitter: File Output Committer
Algorithm version is 1
18/01/06 19:29:28 INFO output.FileOutputCommitter: FileOutputCommitter
skip cleanup _temporary folders under output directory:false, ignore cleanup
failures: false
18/01/06 19:29:28 INFO mapred.LocalJobRunner: OutputCommitter is
org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter
…..
……
……
8/01/06 19:29:35 INFO mapreduce.Job: Job job_local382862986_0001
completed successfully
18/01/06 19:29:35 INFO mapreduce.Job: Counters: 35
File System Counters
FILE: Number of bytes read=1818006
FILE: Number of bytes written=3374967
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
HDFS: Number of bytes read=4397854
HDFS: Number of bytes written=448894
HDFS: Number of read operations=13
HDFS: Number of large read operations=0
HDFS: Number of write operations=4
Map-Reduce Framework
Map input records=37861
Map output records=384260
Map output bytes=3688599
Map output materialized bytes=605509
Input split bytes=108
Combine input records=384260
Combine output records=40059
Reduce input groups=40059
Reduce shuffle bytes=605509
Reduce input records=40059

www.apasoft-training.com 2
Apasoft Training

Reduce output records=40059

Spilled Records=80118
Shuffled Maps =1
Failed Shuffles=0
Merged Map outputs=1
GC time elapsed (ms)=100
Total committed heap usage (bytes)=331489280
Shuffle Errors
BAD_ID=0
CONNECTION=0
IO_ERROR=0
WRONG_LENGTH=0
WRONG_MAP=0
WRONG_REDUCE=0
File Input Format Counters
Bytes Read=2198927
File Output Format Counters
Bytes Written=448894
• Vemos que nos hace un resumen del resultado
• Podemos ver el contenido del directorio
hdfs dfs -ls /practicas/resultado
Found 2 items
-rw-r--r-- 1 hadoop supergroup 0 2018-01-06 19:29
/practicas/resultado/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 448894 2018-01-06 19:29
/practicas/resultado/part-r-00000
• Podemos traerlo desde HDFS al Linux con el comando “get” y lo dejamos en
/tmp con otro nombre
hdfs dfs -get /practicas/resultado/part-r-00000 /tmp/palabras_quijote.txt
Con “vi” podemos ver el contenido
Mal 1
"Al 1
"Cuando 2
"Cuidados 1
"De 2

www.apasoft-training.com 3
Apasoft Training

"Defects," 1
"Desnudo 1
"Dijo 1
"Dime 1
"Don 1
"Donde 1
"Dulcinea 1
"El 2
"Esta 1
"Harto 1
"Iglesia, 1
"Information 1
"Más 2
"No 5
"Nunca 1
"Plain 2
"Project 5
"Que 1
"Quien 1
"Right 1
"Salta 1
"Sancho 1
"Si 3
"Tened 1
"Toda 1
"Vengan 1
"Vete, 1
"/tmp/palabras_quijote.txt" 40059L, 448894C
• Accedemos a la WEB de Administración de YARN.
• Si seleccionamos la opción “Applications” podemos ver la aplicación que
acabamos de lanzar

www.apasoft-training.com 4
Apasoft Training

• A la derecha de la aplicación, si pulsamos sobre “history”, podremos ver

el detalle completo de la aplicación

• Podemos ver información muy valiosa

•

www.apasoft-training.com 5
Apasoft Training

• Seleccionando un mapper o un reducer podemos acceder a su

información: nodo en el que se ha ejecutado, etc…

www.apasoft-training.com 6

5-Practicas+BigData Trabajar Hdfs
No ratings yet
5-Practicas+BigData Trabajar Hdfs
10 pages
CS-702 (D) BigData
No ratings yet
CS-702 (D) BigData
61 pages
Module 3 - Mapreduce
No ratings yet
Module 3 - Mapreduce
40 pages
MapReduce & WordCount Tutorial
No ratings yet
MapReduce & WordCount Tutorial
7 pages
Map Reduce
No ratings yet
Map Reduce
28 pages
CS702 Big Data Programs
No ratings yet
CS702 Big Data Programs
58 pages
Bda Lab S
No ratings yet
Bda Lab S
92 pages
Bda 1
No ratings yet
Bda 1
6 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
3 pages
Hadoop Module1
No ratings yet
Hadoop Module1
37 pages
Big Data Lab Manual Printout
No ratings yet
Big Data Lab Manual Printout
51 pages
Map Reduce
No ratings yet
Map Reduce
30 pages
Bda Lab Manual
No ratings yet
Bda Lab Manual
20 pages
MapReduce & Hadoop for CS Students
No ratings yet
MapReduce & Hadoop for CS Students
25 pages
Hadoop BigData Testing Overview
No ratings yet
Hadoop BigData Testing Overview
37 pages
Parlab Parallel Boot Camp Cloud Computing With Mapreduce and Hadoop
No ratings yet
Parlab Parallel Boot Camp Cloud Computing With Mapreduce and Hadoop
49 pages
Lsde Workshop wk9
No ratings yet
Lsde Workshop wk9
31 pages
CS 425 / ECE 428 Distributed Systems Fall 2014: Lecture 3: Mapreduce and Hadoop
No ratings yet
CS 425 / ECE 428 Distributed Systems Fall 2014: Lecture 3: Mapreduce and Hadoop
24 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
Bda Megh
No ratings yet
Bda Megh
50 pages
Introduction To MapReduce
No ratings yet
Introduction To MapReduce
17 pages
BDA - Unit 3
No ratings yet
BDA - Unit 3
41 pages
Hadoop Lab Practical Guide
No ratings yet
Hadoop Lab Practical Guide
69 pages
03 Firstmrjob Invertedindexconstruction 141206231216 Conversion Gate01 PDF
No ratings yet
03 Firstmrjob Invertedindexconstruction 141206231216 Conversion Gate01 PDF
54 pages
Unit Iii
No ratings yet
Unit Iii
38 pages
Hadoop MapReduce WordCount Guide
No ratings yet
Hadoop MapReduce WordCount Guide
5 pages
Lecture 1 - Map Reduce
No ratings yet
Lecture 1 - Map Reduce
31 pages
MapReduce for Data Engineers
No ratings yet
MapReduce for Data Engineers
30 pages
Hadoop Setup Guide for Students
No ratings yet
Hadoop Setup Guide for Students
49 pages
Distributed Systems: MapReduce Basics
No ratings yet
Distributed Systems: MapReduce Basics
24 pages
Hadoop Lab Hdfs FSB
No ratings yet
Hadoop Lab Hdfs FSB
10 pages
CS702 Big Data Programs
No ratings yet
CS702 Big Data Programs
59 pages
Bda Experiment No2
No ratings yet
Bda Experiment No2
12 pages
02 Hadoop
No ratings yet
02 Hadoop
117 pages
Cloud PDF
No ratings yet
Cloud PDF
47 pages
Hadoop and Spark Overview
No ratings yet
Hadoop and Spark Overview
34 pages
Unit II Hadoop and Map Reduce Overview
No ratings yet
Unit II Hadoop and Map Reduce Overview
136 pages
Hadoop Installation & MapReduce Guide
No ratings yet
Hadoop Installation & MapReduce Guide
13 pages
Week 14
No ratings yet
Week 14
33 pages
Hadoop and MR Programming: DR G Sudha Sadasivam Professor Cse, PSGCT
No ratings yet
Hadoop and MR Programming: DR G Sudha Sadasivam Professor Cse, PSGCT
71 pages
3.4 Map Scheduler
No ratings yet
3.4 Map Scheduler
23 pages
Map Reduce
No ratings yet
Map Reduce
25 pages
HDFS File Operations and MapReduce
No ratings yet
HDFS File Operations and MapReduce
7 pages
@bigdatalabfile 09
No ratings yet
@bigdatalabfile 09
35 pages
Bigdata Lab
No ratings yet
Bigdata Lab
55 pages
Hadoop MapReduce Overview & Usage
No ratings yet
Hadoop MapReduce Overview & Usage
57 pages
Big Data Akshat
No ratings yet
Big Data Akshat
57 pages
TP 2
No ratings yet
TP 2
30 pages
DSBDA GRP B 1
No ratings yet
DSBDA GRP B 1
8 pages
Chapter3 HDFS MapReduce YARN
No ratings yet
Chapter3 HDFS MapReduce YARN
35 pages
Dsbda GRP B Print
No ratings yet
Dsbda GRP B Print
17 pages
BDA Manual
No ratings yet
BDA Manual
41 pages
Hadoop Administrator Training - Lab Hand Book
No ratings yet
Hadoop Administrator Training - Lab Hand Book
12 pages
Cloud Computing & MapReduce Basics
No ratings yet
Cloud Computing & MapReduce Basics
55 pages
Hadoop Single-Node Setup Guide
No ratings yet
Hadoop Single-Node Setup Guide
4 pages
M4 06 MapReduce
No ratings yet
M4 06 MapReduce
28 pages
Data Science Course Overview
No ratings yet
Data Science Course Overview
28 pages
PHP Cookbook
75% (8)
PHP Cookbook
72 pages
Grade 8 Cbse Math 2nd Term Sample Paper 1
100% (1)
Grade 8 Cbse Math 2nd Term Sample Paper 1
2 pages
Efficient Heavy Tail Removal in Cracking
No ratings yet
Efficient Heavy Tail Removal in Cracking
3 pages
(25434292 - Power Electronics and Drives) Single-Phase Line Start Permanent Magnet Synchronous Motor With Skewed Stator
No ratings yet
(25434292 - Power Electronics and Drives) Single-Phase Line Start Permanent Magnet Synchronous Motor With Skewed Stator
8 pages
Did You Know That Over $140 Billion
No ratings yet
Did You Know That Over $140 Billion
11 pages
Penerapan Model Pembelajaran Problem Posing Dan Direct Masalah Matematis Siswa
No ratings yet
Penerapan Model Pembelajaran Problem Posing Dan Direct Masalah Matematis Siswa
12 pages
Physics Project Styrofoam Charge
100% (1)
Physics Project Styrofoam Charge
3 pages
2) Change Control
No ratings yet
2) Change Control
4 pages
HVAC Duct Design Lab Guide
No ratings yet
HVAC Duct Design Lab Guide
8 pages
KG Basin
No ratings yet
KG Basin
8 pages
Nygren Et Al. 2019 Lifelong Learning Formal Non Formal and Informal Learning in The Context of The
No ratings yet
Nygren Et Al. 2019 Lifelong Learning Formal Non Formal and Informal Learning in The Context of The
12 pages
Microprocessor Lecture 10
No ratings yet
Microprocessor Lecture 10
11 pages
NEET/JEE Chemistry Formula Guide
100% (1)
NEET/JEE Chemistry Formula Guide
18 pages
NPT-National Pipe Thread Chart: Connect With Us On: 855.728.5460
No ratings yet
NPT-National Pipe Thread Chart: Connect With Us On: 855.728.5460
1 page
Semana 06 O - Proportioning Concrete Mixtures - Metha Chapter 9
No ratings yet
Semana 06 O - Proportioning Concrete Mixtures - Metha Chapter 9
10 pages
Valve CV Sizing Liquids Gases
No ratings yet
Valve CV Sizing Liquids Gases
22 pages
Pressurization Unit Specs & Details
No ratings yet
Pressurization Unit Specs & Details
16 pages
Final Thesis Copy Nitesh
No ratings yet
Final Thesis Copy Nitesh
109 pages
Vectors and Equilibrium Guide
No ratings yet
Vectors and Equilibrium Guide
14 pages
Cariology: Presented By-Dr. Neha Sultana Post Graduate Student Department of Conservative Dentistry and Endodontics
No ratings yet
Cariology: Presented By-Dr. Neha Sultana Post Graduate Student Department of Conservative Dentistry and Endodontics
93 pages
Millikan Oil Drop Experiment
No ratings yet
Millikan Oil Drop Experiment
6 pages
Thyristor Three-Phase Rectifier/Inverter Guide
100% (1)
Thyristor Three-Phase Rectifier/Inverter Guide
8 pages
Business Process Modeling Training
100% (4)
Business Process Modeling Training
37 pages
TLV Check Valve Ckf3m
No ratings yet
TLV Check Valve Ckf3m
2 pages
Greengrass v2 Developer Guide
No ratings yet
Greengrass v2 Developer Guide
947 pages
PADS Tutorial
No ratings yet
PADS Tutorial
59 pages
Thesis Assignment
No ratings yet
Thesis Assignment
4 pages
J Diamond 2018 03 006
No ratings yet
J Diamond 2018 03 006
22 pages
Nuclear Physics Foundations
No ratings yet
Nuclear Physics Foundations
21 pages

9 Practicas+BigData MapReduce

Uploaded by

9 Practicas+BigData MapReduce

Uploaded by

Apasoft Training

18/01/06 19:29:28 INFO mapred.LocalJobRunner: OutputCommitter set in

Reduce output records=40059

• A la derecha de la aplicación, si pulsamos sobre “history”, podremos ver

• Podemos ver información muy valiosa

• Seleccionando un mapper o un reducer podemos acceder a su

You might also like