Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

pp_kr1.doc

Скачиваний:

Добавлен:

13.11.2019

Размер:

915.46 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 169 10 11 12 13 14 15 16 > Следующая >>>

12 .Метод пирамид.

*В методе пирамид в исходном пространстве итераций выделяются независимые параллельные ветви, каждая из которых представляет собою «дерево» зависимых итераций, корень которого – одна из результирующих итераций исходного цикла. Если индексные выражения в теле цикла линейно зависимы, то итерации каждой параллельной ветви образуют пирамиду (в случае двумерного пространства итераций это – угол между некоторыми крайними векторами). Очевидно, что при таком порядке формирования ветвей в них неизбежно дублирование некоторых итераций.

Э тот метод используется в вычислительных системах со стековой организацией, в которых крайне нежелателен обмен информацией между параллельными процессами и затруднена синхронизация между ними.

Если имеются такие ограничения, то исходное гнездо циклов требуется преобразовать таким образом, чтобы все параллельные ветви были автономны. То есть все использования переменных одной ветви соответствовали генерациям той же самой ветви.

Для этого:

1. в цикле выбираются все результирующие итерации. Каждая такая итерация служит основой отдельной параллельной ветви.

2. каждая ветвь формируется путем включения в нее всех итераций, информационно связанных с ранее включенными в эту ветвь итерациями.

«-»:необходимость дублирования некоторых операций в разных ветвях.

При ленейно-независимых индексных выражениях итерации каждой ветви образуют пирамиду в пространстве итераций, «натянутую на векторы», задающие направление зависимостей внутри итераций.

ПРИМЕР:

DO 10 I₁=1,R₁

DO 10 I₂=1,R₂

<ТЕЛО ЦИКЛА>

10 Continue

После использования метода пирамид получаются конструкции вида:

DO 10 CONC FOR ALL K{1,…,R_r}

DO 10 I₁=1,R₁

DO 10 I₂=MAX{1,K-[(R₁-I₁)G₂/G₁]}, MIN{R₂,K+[(R₁-I₁)H₂/H₁]}

<ТЕЛО ЦИКЛА>

10 Continue

Д ля векторно-конвейерной системы (SIMD) метод пирамид очень неэффективен.

13. Распараллеливание линейных участков программ.

Распараллеливание линейных участков

Распараллеливание линейных участков применяется главным образом в системах с магистральной обработкой данных, когда одна команда разбивается на ряд последовательных микроопераций, выполняющихся над несколькими аргументами параллельно.

Факторами резко снижающим эффективность таких систем являются:

- команды условных и безусловных переходов,

- информационная зависимость операторов,

- косвенная адресация.

В настоящее время считается, что основной выигрыш при распараллеливании линейных участков получается при выявлении параллелизма на уровне отдельных операторов.

Рассмотрим i-тый участок памяти. Все переменные, которые изменяются на этом учаcтке можно отнести к одной из четырех категорий:

Только считываемые переменные W_i
Только записываемые переменные X_i
Сначала считываемые, а потом записываемые Y_i
Сначала записываемые, а потом считываемые Z_i

С учетом таких обозначений для любой пары операторов P1 и P2 на этом участке должны выполняться следующие соотношения:

(W1Y1Z1)(X2Y2Z2)=0

(X1Y1Z1)(W2Y2Z2)=0

Если эти условия выполняются, то операторы независимы и могут быть выполнены параллельно.

Алгоритм

Для рассмотрения одного из возможных алгоритмов распараллеливания введем следуюшие обозначения:

I_i – входные данные для i-того оператора, т.е. переменные в правой части оператора присваивания

Oi –выходные данные, т.е. переменные в левой части оператора присваивания.

Для независимости двух операторов i-го и j-го необходимо выполнения следующих соотношений:

Проверка этих условий является основной частью алгоритма автоматического выполнения параллелизма.

П РИМЕР: Пусть исходный линейный участок задан орграфом

Есть матрица смежности для него

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	1	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	1	0	0	0
7	0	0	0	1	0	1	0	0
8	0	0	0	0	0	0	1	0

Матрица передачи управления

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	0	0	0	0	0	0
8	0	0	0	0	0	0	0	0

Очевидно, что для распараллеливания необходимы еще входные/выходные данные. Они так же представляются булевскими матрицами m на n, где n строк представляют операторы, а m столбцов - идентификаторы переменных. В нашем случае 5 переменных, поэтому матрица 8 строк и 5 столбцов

	1	2	3	4	5
1	0	0	0	0	0
2	0	1	0	0	0
3	1	0	0	0	0
4	0	1	0	0	0
5	0	0	0	0	1
6	0	1	0	0	0
7	0	0	1	1	0
8	0	0	0	0	1

	1	2	3	4	5
1	0	1	0	0	0
2	0	0	0	0	0
3	0	0	1	0	0
4	0	0	0	1	0
5	0	0	1	0	0
6	0	0	0	1	0
7	0	0	0	0	1
8	0	0	0	0	0

В этих матрицах соответствующий элемент равен единице в том случае если переменная с номером j является входной для оператора I. Для матрицы O, соответственно, та же единица соответствует выходной.

В результате работы предлагаемого алгоритма будет получена матрица C_p и L_p, которые однозначно описывают параллельную форму для исходного алгоритма, и соответствующая граф схема (уже параллельная) будет выглядеть так.

Для построения матрицы C_p сначала строится матрица последовательности выполнения операторов для исходного участка, матрица P.

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
0	1	1	0	0	0	0	0	0
4	1	1	1	0	0	0	0	0
5	1	1	0	0	0	0	0	0
6	1	1	0	0	1	0	0	0
7	1	1	1	1	1	1	0	0
8	1	1	1	1	1	1	1	0

В ней отображен порядок следования операторов.

Для построения матрицы C_p необходимо простроить две матрицы P_p (матрица неполного параллелизма) и L_p (матрица параллельной логики).

Алгоритм построения матрицы C_P_.

Стоятся вспомогательные матрицы P_p=P (матрица неполного параллелизма) и L_p=L (матрица параллельной логики)
Для всех пар (i, j), для которых элемент матрицы P равен единице («1»), вычисляется функция

IO_i^j = (I_j O_i) (I_i O_j) (O_i O_j)

Если IO_i^j = 0, то операторы i и j – независимы, т.е их можно выполнять параллельно или сохранить последовательность выполнения, для этого случая соответствующий элемент матрицы P устанавливается в нуль (P_Pi^j = 0).

Для сохранения логических связей вычисляется элементы

L_Pi = L_i L_j,

где:

Li – i-тая строка матрицы L_p

L_j – j – итая строка матрицы L

В результате логическая связь, ведущая к оператору j будет идти и к оператору i.

Строится вспомогательная матрица C_p’= P_P ( ), в которой сохраняются только прямые связи длиной 1.
Находим искомую матрицу C_p= L_p  C_p’.

Данные матрицы имеют следующий вид:

P_p

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	0	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	0	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

L_p

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	0	0	0	1	0	0
8	0	0	0	0	0	0	0	0

C_p

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

Недостатки алгоритма.

Все входящие и выходящие переменные рассматриваются как элементарные, анализ элементов не производиться, что влияет на качество полученной параллельной формы.
Если в исходной программе для экономии памяти один и тот же идентификатор обозначает разные переменные, то фактически независимые операторы будут считаться информационно-связанными.

ПРИМЕР:

1 A=B+C

2 D=A+E

3 A=X+Y

4 F=A*Z

1 A1=B+C

2 D=A1+E

3 A=X+Y

4 F=A*Z

На этом линейном участке все операторы должны выполнятся строго последовательно, однако если переписать как указано ниже, то пары операторов 1,2 и 3,4 являются независимы и могут выполнятся параллельно.

Виды зависимостей между переменными:

Информационная;
Конкуренционная:

1 типа;
2 типа;

Транзитивная;
Логическая.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 169 10 11 12 13 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.06.2015120.83 Кб10Polozhenie_KiB.doc
#
05.06.2015856.41 Кб19Potanin_Elementi_gidrodinamiki.pdf
#
24.04.20192.27 Mб7PowerPoint.doc
#
05.06.20151.21 Mб405ppmanual.pdf
#
05.06.2015158.38 Кб8ppt.pdf
#
13.11.2019915.46 Кб13pp_kr1.doc
#
10.12.2018377.86 Кб5PP_KR22.doc
#
10.12.2018507.9 Кб9PP_KR22.doc
#
13.11.2019126.18 Кб1PRA Y7-06.docx
#
13.11.2019267.78 Кб1PRA У7-03.doc
#
05.06.20151.06 Mб613Praktikum_po_teorii_algoritmov-2011.pdf

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	1	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	1	0	0	0
7	0	0	0	1	0	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	0	0	0	0	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
0	1	1	0	0	0	0	0	0
4	1	1	1	0	0	0	0	0
5	1	1	0	0	0	0	0	0
6	1	1	0	0	1	0	0	0
7	1	1	1	1	1	1	0	0
8	1	1	1	1	1	1	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	0	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	0	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	0	0	0	1	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	1	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	1	0	0	0
7	0	0	0	1	0	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	0	0	0	0	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
0	1	1	0	0	0	0	0	0
4	1	1	1	0	0	0	0	0
5	1	1	0	0	0	0	0	0
6	1	1	0	0	1	0	0	0
7	1	1	1	1	1	1	0	0
8	1	1	1	1	1	1	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	0	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	0	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	0	0	0	1	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	1	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	1	0	0	0
7	0	0	0	1	0	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	0	0	0	0	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
0	1	1	0	0	0	0	0	0
4	1	1	1	0	0	0	0	0
5	1	1	0	0	0	0	0	0
6	1	1	0	0	1	0	0	0
7	1	1	1	1	1	1	0	0
8	1	1	1	1	1	1	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	0	0	0	0	0	0	0
4	0	0	0	0	0	0	0	0
5	0	0	0	0	0	0	0	0
6	0	0	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	0	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	0	0	0	1	0	0
8	0	0	0	0	0	0	0	0

	1	2	3	4	5	6	7	8
1	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0
3	0	1	0	0	0	0	0	0
4	0	1	0	0	0	0	0	0
5	0	1	0	0	0	0	0	0
6	0	1	0	0	0	0	0	0
7	0	0	1	1	1	1	0	0
8	0	0	0	0	0	0	1	0