0% found this document useful (0 votes)

52 views30 pages

Automatic Parallelization - 2: Y.N. Srikant

This document discusses data dependence analysis and direction vectors which are used to determine whether loops can be parallelized or vectorized. It provides examples of how direction vectors classify dependence as forward, backward, or equal and explains how this relates to parallelizing loops. It also discusses using loop transformations like scalar expansion, renaming, interchange and fission to break dependencies and increase parallelism.

Uploaded by

supriyaa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

52 views30 pages

Automatic Parallelization - 2: Y.N. Srikant

Uploaded by

supriyaa

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 30

Automatic Parallelization - 2

Y.N. Srikant

Department of Computer Science

Indian Institute of Science
Bangalore 560 012

NPTEL Course on Principles of Compiler Design

Y.N. Srikant Automatic Parallelization

Data Dependence Relations

Y.N. Srikant Automatic Parallelization

Data Dependence Direction Vector
Data dependence relations are augmented with a direction
of data dependence (direction vector)
There is one direction vector component for each loop in a
nest of loops
The data dependence direction vector (or direction vector)
is Ψ = (Ψ1 , Ψ2 , ..., Ψd ), where Ψk ∈ {<, =, >, ≤, ≥, 6=, ∗}
Forward or “<” direction means dependence from iteration i
to i + k (i.e., computed in iteration i and used in iteration
i + k)
Backward or “>” direction means dependence from
iteration i to i − k (i.e., computed in iteration i and used in
iteration i − k ). This is not possible in single loops and
possible in two or higher levels of nesting
Equal or “=” direction means that dependence is in the
same iteration (i.e., computed in iteration i and used in
iteration i)
Y.N. Srikant Automatic Parallelization
Direction Vector Example 1

Y.N. Srikant Automatic Parallelization

Direction Vector Example 2

Y.N. Srikant Automatic Parallelization

Direction Vector Example 3

Y.N. Srikant Automatic Parallelization

Direction Vector Example 4

Y.N. Srikant Automatic Parallelization

Data Dependence Graph and Vectorization

Individual nodes are statements of the program and edges

depict data dependence among the statements
If the DDG is acyclic, then vectorization of the program is
possible and is straightforward
Vector code generation can be done using a topological
sort order on the DDG
Otherwise, find all the strongly connected components of
the DDG, and reduce the DDG to an acyclic graph by
treating each SCC as a single node
SCCs cannot be fully vectorized; the final code will contain
some sequential loops and possibly some vector code

Y.N. Srikant Automatic Parallelization

Data Dependence Graph and Vectorization

If all the dependence relations in a loop nest have a

direction vector value of “=” for a loop, then the iterations of
that loop can be executed in parallel with no
synchronization between iterations
Any dependence with a forward (<) direction in an outer
loop will be satisfied by the serial execution of the outer
loop
If an outer loop L is run in sequential mode, then all the
dependences with a forward (<) direction at the outer level
(of L) will be automatically satisfied (even those of the
loops inner to L)
However, this is not true for those dependences with with
(=) direction at the outer level; the dependences of the
inner loops will have to be satisfied by appropriate
statement ordering and loop execution order

Y.N. Srikant Automatic Parallelization

Vectorization Example 1

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.1

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.2

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.3

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.4

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.5

Y.N. Srikant Automatic Parallelization

Vectorization Example 2.6

Y.N. Srikant Automatic Parallelization

Concurrentization Examples

Y.N. Srikant Automatic Parallelization

Loop Transformations for increasing Parallelism

Recurrence breaking
Ignorable cycles
Scalar expansion
Scalar renaming
Node splitting
Threshold detection and index set splitting
If-conversion
Loop interchanging
Loop fission
Loop fusion

Y.N. Srikant Automatic Parallelization

Scalar Expansion

Y.N. Srikant Automatic Parallelization

Scalar Expansion is not always profitable

Y.N. Srikant Automatic Parallelization

Scalar Renaming

Y.N. Srikant Automatic Parallelization

If-Conversion

Y.N. Srikant Automatic Parallelization

Loop Interchange

For machines with vector instructions, inner loops are

preferrable for vectorization, and loops can be
interchanged to enable this
For multi-core and multi-processor machines, parallel outer
loops are preferred and loop interchange may help to make
this happen
Requirements for simple loop interchange
1 The loops L1 and L2 must be tightly nested (no statements
between loops)
2 The loop limits of L2 must be invariant in L1
3 There are no statements Sv and Sw (not necessarily
∗
distinct) in L1 with a dependence Sv δ(<,>) Sw

Y.N. Srikant Automatic Parallelization

Loop Interchange for Vectorizability

Y.N. Srikant Automatic Parallelization

Loop Interchange for parallelizability

Y.N. Srikant Automatic Parallelization

Legal Loop Interchange

Y.N. Srikant Automatic Parallelization

Illegal Loop Interchange

Y.N. Srikant Automatic Parallelization

Legal but not beneficial Loop Interchange

Y.N. Srikant Automatic Parallelization

Loop Fission - Motivation

Y.N. Srikant Automatic Parallelization

Loop Fission: Legal and Illegal

Y.N. Srikant Automatic Parallelization

Jss Academy of Technical Education, BANGALORE-560060: Topic: Automatic Loop Vectorizarion in Parallel Computing
No ratings yet
Jss Academy of Technical Education, BANGALORE-560060: Topic: Automatic Loop Vectorizarion in Parallel Computing
14 pages
14-Parallelization and Automatic Parallelization-08!11!2024
No ratings yet
14-Parallelization and Automatic Parallelization-08!11!2024
50 pages
CS-3006 9 DependenceAnalysis
No ratings yet
CS-3006 9 DependenceAnalysis
67 pages
PDC Lecture 04
No ratings yet
PDC Lecture 04
44 pages
PP Unit 2 Tesseract
No ratings yet
PP Unit 2 Tesseract
38 pages
F10 - Parallelizing Compilers
No ratings yet
F10 - Parallelizing Compilers
77 pages
c3 Dependence Analysis p1
No ratings yet
c3 Dependence Analysis p1
32 pages
2 TypesofParallelism
No ratings yet
2 TypesofParallelism
69 pages
Module 7
No ratings yet
Module 7
28 pages
Data Dependence & Parallelization
No ratings yet
Data Dependence & Parallelization
13 pages
Understanding Parallel DOALL Loops
No ratings yet
Understanding Parallel DOALL Loops
7 pages
Auto Vectorization
No ratings yet
Auto Vectorization
11 pages
Capp 1
No ratings yet
Capp 1
38 pages
L19 Parallelization
No ratings yet
L19 Parallelization
11 pages
Language-Based Vectorization and Parallelization Using Intrinsics, Openmp, TBB and Cilk Plus
No ratings yet
Language-Based Vectorization and Parallelization Using Intrinsics, Openmp, TBB and Cilk Plus
12 pages
Data Level Parallelism in Smid Andvector and Gpu: BY 19PW40 S.Sayana
No ratings yet
Data Level Parallelism in Smid Andvector and Gpu: BY 19PW40 S.Sayana
18 pages
Dependence Alanysis and Loop Normalization
No ratings yet
Dependence Alanysis and Loop Normalization
23 pages
Layers of Implementing An Application in Software or Hardware Using Parallel Computers
No ratings yet
Layers of Implementing An Application in Software or Hardware Using Parallel Computers
46 pages
Unit 3 - Book
No ratings yet
Unit 3 - Book
37 pages
L19-20 PA Design Intro
No ratings yet
L19-20 PA Design Intro
31 pages
Compiler Autovectorization Guide
No ratings yet
Compiler Autovectorization Guide
41 pages
002 IntroHPC
No ratings yet
002 IntroHPC
33 pages
Lecture 7 MPP Architecture & Dependence Analysis-1
No ratings yet
Lecture 7 MPP Architecture & Dependence Analysis-1
23 pages
CompilerAutovectorizationGuide
No ratings yet
CompilerAutovectorizationGuide
39 pages
Program and Network Properties 2.1 Conditions of Parallelism 2.2 Program Partitioning and Scheduling
No ratings yet
Program and Network Properties 2.1 Conditions of Parallelism 2.2 Program Partitioning and Scheduling
47 pages
Wolf and Lam
No ratings yet
Wolf and Lam
38 pages
Data Dependences: CS 524 - High-Performance Computing
No ratings yet
Data Dependences: CS 524 - High-Performance Computing
20 pages
Hardware vs. Software Parallelism
50% (2)
Hardware vs. Software Parallelism
55 pages
An Introduction To Vectorization With Intel Fortran Compiler 021712
No ratings yet
An Introduction To Vectorization With Intel Fortran Compiler 021712
6 pages
An Introduction To Vectorization With Intel Fortran Compiler 021712
No ratings yet
An Introduction To Vectorization With Intel Fortran Compiler 021712
6 pages
Ui Design 100 Report
No ratings yet
Ui Design 100 Report
4 pages
Module 5 Instruction Level Parallelism and Pipelining
No ratings yet
Module 5 Instruction Level Parallelism and Pipelining
54 pages
Lecture 4
No ratings yet
Lecture 4
29 pages
Dependencies, Instruction Scheduling, Optimization, and Parallelism
No ratings yet
Dependencies, Instruction Scheduling, Optimization, and Parallelism
49 pages
c3 Dependence Analysis p2
No ratings yet
c3 Dependence Analysis p2
22 pages
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 26-Aug-2021 Module2-SIMD-VectorProcessors
No ratings yet
FALLSEM2021-22 CSE4001 ETH VL2021220104078 Reference Material I 26-Aug-2021 Module2-SIMD-VectorProcessors
16 pages
Explicit Vector Programming in Fortran - Intel® Developer Zone
No ratings yet
Explicit Vector Programming in Fortran - Intel® Developer Zone
10 pages
CA Classes-21-25
No ratings yet
CA Classes-21-25
5 pages
Optimal Loop Parallelization For Maximizing Iteration-Level Parallelism
No ratings yet
Optimal Loop Parallelization For Maximizing Iteration-Level Parallelism
10 pages
Dependency-Based Automatic Parallelization of Java Applications
No ratings yet
Dependency-Based Automatic Parallelization of Java Applications
13 pages
Loop Parallelization and Pipelining
No ratings yet
Loop Parallelization and Pipelining
14 pages
Implicit Parallelism
No ratings yet
Implicit Parallelism
18 pages
Clase01 - Introducción Al Paralelismo
No ratings yet
Clase01 - Introducción Al Paralelismo
30 pages
Intro To Parallel Computing
No ratings yet
Intro To Parallel Computing
127 pages
Clase01 - Introducción Al Paralelismo
No ratings yet
Clase01 - Introducción Al Paralelismo
30 pages
Parallel Computing Dependencies
No ratings yet
Parallel Computing Dependencies
27 pages
OpenACC Fundamentals
No ratings yet
OpenACC Fundamentals
38 pages
Daa 1
No ratings yet
Daa 1
40 pages
Lecture 6 Principles of Parallel Algorithm Design
No ratings yet
Lecture 6 Principles of Parallel Algorithm Design
35 pages
19 Computer Architecture Vector Processor
No ratings yet
19 Computer Architecture Vector Processor
20 pages
Parallel Architectures Parallel Architectures: Ever Faster
No ratings yet
Parallel Architectures Parallel Architectures: Ever Faster
11 pages
Literature Review Samples
No ratings yet
Literature Review Samples
2 pages
Topic2c Ss Dynamicscheduling
No ratings yet
Topic2c Ss Dynamicscheduling
94 pages
Parallel Programming 1
No ratings yet
Parallel Programming 1
32 pages
Ca Part 3
No ratings yet
Ca Part 3
20 pages
Dependency Analysis of For-Loop Structures For Automatic Parallelization of C Code
No ratings yet
Dependency Analysis of For-Loop Structures For Automatic Parallelization of C Code
13 pages
Lecture 5
No ratings yet
Lecture 5
80 pages
Vector
No ratings yet
Vector
38 pages
Parallel Computing Unit 3 - Principles of Parallel Computing Design
No ratings yet
Parallel Computing Unit 3 - Principles of Parallel Computing Design
78 pages
PHAR Jeeva
No ratings yet
PHAR Jeeva
19 pages
UI Design for Object-Oriented Systems
No ratings yet
UI Design for Object-Oriented Systems
53 pages
Pharmacy Database Management
No ratings yet
Pharmacy Database Management
14 pages
Chap11 PDF
No ratings yet
Chap11 PDF
84 pages
Chap9 PDF
No ratings yet
Chap9 PDF
37 pages
Chap4 PDF
No ratings yet
Chap4 PDF
64 pages
Active Databases: PSG College of Technology, Coimbatore - 4 Department of Applied Mathematics and Computational Sciences
No ratings yet
Active Databases: PSG College of Technology, Coimbatore - 4 Department of Applied Mathematics and Computational Sciences
3 pages
Detecting Cyber Threats Through Social Network Ana PDF
No ratings yet
Detecting Cyber Threats Through Social Network Ana PDF
16 pages
Remote Control Software Guide
No ratings yet
Remote Control Software Guide
27 pages
Ravan Tantra Uddish
No ratings yet
Ravan Tantra Uddish
81 pages
AWS Sysops Administrator Syllabus
No ratings yet
AWS Sysops Administrator Syllabus
4 pages
Excel Macros Guide PDF Download
No ratings yet
Excel Macros Guide PDF Download
2 pages
Introduction To C++
No ratings yet
Introduction To C++
306 pages
Remote Home Automation Through Internet
No ratings yet
Remote Home Automation Through Internet
108 pages
Computer Lab Checklists
100% (3)
Computer Lab Checklists
2 pages
TemenosLRT T24
100% (2)
TemenosLRT T24
2 pages
CPR MSBTE - Winter 2008
No ratings yet
CPR MSBTE - Winter 2008
2 pages
Jan 06
No ratings yet
Jan 06
2 pages
Archmodels Vol 171 PDF
No ratings yet
Archmodels Vol 171 PDF
16 pages
How To Run XSLT 2.0 Stylesheets With Eclipse?
No ratings yet
How To Run XSLT 2.0 Stylesheets With Eclipse?
3 pages
S Aes
No ratings yet
S Aes
5 pages
Embedded Linux: Using Pee Wee Linux
100% (1)
Embedded Linux: Using Pee Wee Linux
31 pages
Algorithms in C
100% (1)
Algorithms in C
4 pages
Windows Server 2008 Setup Guide
No ratings yet
Windows Server 2008 Setup Guide
59 pages
Computer Parts Vendors in Western Region
No ratings yet
Computer Parts Vendors in Western Region
9 pages
I2c Slave
No ratings yet
I2c Slave
4 pages
Manual Fluke Proxim8
No ratings yet
Manual Fluke Proxim8
47 pages
User Guide: For TP-Link Omada Access Points
No ratings yet
User Guide: For TP-Link Omada Access Points
104 pages
Image Measurement with MATLAB
No ratings yet
Image Measurement with MATLAB
23 pages
How Do You Import DBs in A STEP 7 (TIA Portal) Project That Were Created in Other Projects or With Earlier Versions of STEP 7
0% (1)
How Do You Import DBs in A STEP 7 (TIA Portal) Project That Were Created in Other Projects or With Earlier Versions of STEP 7
3 pages
GPU History & CUDA Programming Basics
No ratings yet
GPU History & CUDA Programming Basics
44 pages
Breaking Hitag2
100% (1)
Breaking Hitag2
16 pages
KeeLoq Security Vulnerabilities
No ratings yet
KeeLoq Security Vulnerabilities
19 pages
HW7 Questions
No ratings yet
HW7 Questions
3 pages
Effective Data Flow in ZigBee Network Using OPNET
No ratings yet
Effective Data Flow in ZigBee Network Using OPNET
4 pages
Practical Week 2 GUI Construction: Exercise 1 Digital Stopwatch
No ratings yet
Practical Week 2 GUI Construction: Exercise 1 Digital Stopwatch
4 pages
Fenwick Tree
No ratings yet
Fenwick Tree
18 pages
Lab7 Opensflow
No ratings yet
Lab7 Opensflow
11 pages

Automatic Parallelization - 2: Y.N. Srikant

Uploaded by

Automatic Parallelization - 2: Y.N. Srikant

Uploaded by

Automatic Parallelization - 2

Department of Computer Science

NPTEL Course on Principles of Compiler Design

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Individual nodes are statements of the program and edges

Y.N. Srikant Automatic Parallelization

If all the dependence relations in a loop nest have a

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

For machines with vector instructions, inner loops are

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

Y.N. Srikant Automatic Parallelization

You might also like