Добавил:

Tushkan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Параллельные вычислительные системы

Файл:

Файлы для подготовки к экзамену / Анализ вычислительной сложности ФС

.doc

Скачиваний:

Добавлен:

28.06.2014

Размер:

86.53 Кб

Скачать

☆

Анализ вычислительной сложности ФС и их целенаправленные эквивалентные преобразования

Методы оценки вычислительной сложности позволяют получить числовые характеристики сложности параллельного выполнения ФС программ по сложностным оценкам элементарных функций, используемым при их написании.

Исчисление эквивалентности ФС программ дает возможность осуществлять их целенаправленные эквивалентные преобразования. Целью таких преобразований может быть улучшение некоторых качеств программы, например, времени параллельного выполнения.

1. Анализ вычислительной сложности функциональных программ

Практический интерес представляет возможность получения точных оценок времени параллельного выполнения функциональных программ (ФП) при достаточно общих предположениях: известных данных о времени выполнения элементарных функций в ФП и вероятности осуществления (неосуществления) условных переходов в ней.

В [1] разработана формальная система, позволяющая определять время параллельного вычисления значений функций по заданным характеристикам временной сложности элементарных функций, входящих в представление функции, и вероятностям осуществления условных переходов.

Пусть задана функциональная схема (ФС) X_i = t_i, i = 1, 2, … ,n; F = {f_i | i = 1, 2, …, k} – множество всех входящих в термы t_i, i = 1, 2, …, n, базисных функций.

В [1] показано, что термы t_i в задании ФС могут быть представлены в эквивалентной форме t_i= t_i1 t_i2 …  t_i_k, i = 1, 2, …, n, где каждый терм t_i_j не содержит операции ортогонального объединения  и все термы попарно ортогональны.

Пусть C(R) – функция, определяющая сложность параллельного вычисления значения функции R.

Для любой базисной функции f_i предполагается, что C(f_i) задано и представляет собой некоторое действительное число. Также предполагается, что на области определения D_R интересующей функции R для каждого терма t_i_j в описанном выше ее представлении задана вероятность q_ij того, что именно его значение будет определено при вычислении значения t_i(d) для dD_R. Эта вероятность напрямую связана в общем случае с условием, определяющим выполнение этого события. Также должно выполняться естественное требование для любого i.

При этих условиях сложность параллельного вычисления значения функций X_i в задании ФС может быть определена следующим образом [1].

По заданию ФС последовательно вычисляются «приближения» фиксированной точки для X_i согласно известной процедуре [1]:

X_i⁽⁰⁾ =  (нигде неопределенная функция),

X_i⁽^k⁺¹⁾ = [X_j⁽^k⁾/X_j | j = 1, 2, …, n]t_i, i = 1, 2, …, n, k>=0. Здесь [X_j⁽^k⁾/X_j | j = 1, 2, …, n]t_iесть результат одновременной подстановки переменных X_j⁽^k⁾ вместо всех вхождений X_jв терм t_i_.

Очевидно, терм в правой части приближения X_j⁽^k⁾ не содержит функциональной переменной X_i. После его приведения к указанной выше эквивалентной форме, согласно [2], его вычислительная сложность определяется индукцией по построению:

C(f_i) = t_i (время вычисления значения базисной функции f_i)

C(tt) = max{C(t) , C(t)}

C(tt) = max{C(t) , C(t)}

C(tt) = C(t) + C(t)

Зная в ортогональном представлении X_i⁽^k⁾ = t_i1⁽^k⁾t_i2⁽^k⁾ . ..t_i_vi⁽^k⁾ вероятности q_ij, i, j = 1, 2, …, v_i, того, что при вычислении значения X_i⁽^k⁾(d) будет определено t_i_j⁽^k⁾(d) = d (остальные значения t_i_t⁽^k⁾(d), i_t  i_j, будут не определены в силу того, что функции t_i_j⁽^k⁾, i = 1, 2, …, v_iпопарно ортогональны) можно считать, что среднее время вычисления X_i⁽^k⁾(d) для любого d из области определения X_imin (минимальной фиксированной точки для X_i) равно .

Более точно, эта формула есть промежуточный шаг в определении среднего времени вычисления X_imin при применении X_imin к любому элементу из области ее определения.

Среднее время параллельного вычисления значений функции X_imin определяется как C_i(X_i⁽^kmin⁾) для минимального значения k = k_min такого, что |C_i(X_i⁽^k⁾) - C_i(X_i⁽^k⁺¹⁾)|  , где заданная  – точность вычисления среднего значения.

Описанная итеративная процедура вычисления среднего времени параллельного вычисления значений функций сходится [1]. Вместо нее можно применять другой, точный метод вычисления среднего значения, который сводится к решению множества систем линейных уравнений, построенных по ФС, в которых в качестве неизвестных выступают средние времена сложности C(X_i) параллельных вычислений значений функций X_i в задании ФС. Рассмотрим этот метод на примерах.

Пример 1. Вычисление факториала.

Scheme factorial

{

factorial = (id*<0>).eq -> <1> + (id*<0>).ne -> (id * (id*<1>).minus.@) . mult;

}

Зададим оценки сложности выполнения элементарных функций:

Элементарная функция F	Сложность элементарной функции C(F)
id	15
const	5
eq	15
ne	15
minus	10
mult	20

Пусть p1 – вероятность выполнения левой ветви, p2 – вероятность выполнения правой ветви. Понятно, что p1 + p2 = 1. Отметим, что в нашем случае, p1 = 1/(n + 1).

Вычислим сложность данной ФС при параллельном выполнении:

C0(factorial) = p1∙C0((id*<0>).eq  <1>) + p2∙C0((id*<0>).ne  (id*(id*<1>).minus. factorial).mult) = p1∙max{C0((id*<0>).eq), C(<1>)} + p2∙max{C0((id*<0>).ne), C0(id*(id*<1>).minus. factorial) + C0(mult)} = p1∙max{C0(id*<0>) + C0(eq), C0(<1>)} + p2∙max{C0(id*<0>) + C0(ne), C0(id*(id*<1>).minus) + C0(factorial) + C0(mult)} = p1∙max{max{C0(id), C0(<0>)} + C0(eq), C0(<1>)} + p2∙max{max{C0(id), C0(<0>)} + C0(ne), C0(id*(id*<1>)) + C0(minus) + C0(factorial) + C0(mult)} = p1∙max{max{15, 5} + 15, 5} + p2∙max{max{15, 5} + 15, max{C0(id), C0(id*<1>)} + C0(minus) + C0(factorial) + C0(mult)} = p1∙max{30, 5} + p2∙max{30, max{15, max{C0(id), C0(<1>)} + C0(minus) +C0(factorial) + C0(mult)} = 30∙p1 + p2∙max{30, max{15, max{15, 5} + 10 + C0(factorial) + 20} = 30∙p1 + p2*max{30, max{15, 15 + 10 + C0(factorial) + 20}} = 30∙p1 + p2∙max{30, 45 + C0(factorial)} = 30∙p1 +p2∙(45 + C0(factorial)).

Т.о., имеем: C0(factorial) = 30∙p1 + 45∙p2 + p2∙C0(factorial). Откуда получаем: C0(factorial) = (30∙p1 + 45∙p2)/(1 – p2). При p1 = 0.1 и p2 = 0.9 получаем сложность параллельного выполнения C0(factorial) = 435.

Вычислим, далее, сложность ФС при последовательном выполнении:

C1(factorial) = p1∙C1((id*<0>).eq  <1>) + p2∙C1((id*<0>).ne  (id*(id*<1>).minus. factorial).mult) = p1∙(C1((id*<0>).eq) + C1(<1>)) + p2∙(C1((id*<0>).ne) + C1((id*(id*<1>).minus. factorial).mult)) = p1∙(C1(id*<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id*<0>) + C1(ne) + C1(id*(id*<1>).minus. factorial)) + C1(mult)) = p1∙(C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id) + C1(<0>) + C1(ne) + C1(id*(id*<1>).minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id) + C1(<0>) + C1(ne) + C1(id*(id*<1>)) + C1(minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙( C1(id) + C1(<0>) + C1(ne) + C1(id) + C1(id*<1>) + C1(minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙( C1(id) + C1(<0>) + C1(ne) + C1(id) + C1(id) + C1(<1>) + C1(minus) + C1(factorial) + C1(mult)) = p1∙(15 + 5 + 15 + 5) + p2∙(15 + 5 + 15 + 15 + 15 + 5 + 10 + C1(factorial) + 20) = 40∙p1 + p2∙(100 + C1(factorial)).

Т.о., имеем: C1(factorial) = 40∙p1 + 100∙p2 + p2∙C1(factorial). Откуда получаем: C1(factorial) = (40∙p1 + 100∙p2)/(1 – p2). При p1 = 0.1 и p2 = 0.9 получаем сложность последовательного выполнения C1(factorial) = 940

Ответ: C0(factorial) = 435, C1(factorial) = 940 (при заданных значениях сложностей элементарных функций и вероятностей условных переходов).

В приведенном примере рассматриваемая ФС состояла из одного функционального уравнения. Далее рассмотрим пример ФС, состоящей из нескольких функциональных уравнений.

Пример 2. Вычисление факториала методом “разделяй и властвуй”.

Scheme factorial

{

factorial = (<1>*id).F;

F = eq -> I(1,2) + ne -> ((I(1,2)*AVG).F * (AVG.INC * I(2,2)).F).mult;

AVG = (plus*<2>).div.round;

INC = (id*<1>).plus;

}

Зададим оценки сложности выполнения элементарных функций:

Элементарная функция F	Сложность элементарной функции C(F)
id	15
const	5
eq	15
ne	15
I	1
mult	20
plus	10
div	20
round	10

Вычислим сложность данной ФС при параллельном выполнении:

C0(factorial) = C0((<1>*id).F);

C0(F) = p1∙C0(eq  I(1,2)) + p2∙C0(ne  ((I(1,2)*AVG).F*(AVG.INC*I(2,2)).F).mult);

C0(AVG) = C0((plus*<2>).div.round);

C0(INC) = C0((id*<1>).plus);

p1 и p2 во втором уравнении – вероятности выполнения левой и правой ветвей в условном переходе (в определении F) соответственно.

C0(factorial) = C0(<1>*id) + C0(F) = max{C0(<1>), C0(id)} + C0(F) = max{5, 15} + C0(F) = 15 + C0(F);

C0(AVG) = C0((plus*<2>).div) + C0(round) = C0(plus*<2>) + C0(div) + C0(round) = max{C0(plus), C0(<2>)} + C0(div) + C0(round) = max{10, 5} + 20 + 10 = 40;

C0(INC) = C0(id*<1>) + C0(plus) = max{C0(id), C0(<1>)} + C0(plus) = max{15, 5} + 10 = 25;

C0(F) = p1∙max{C0(eq), C0(I(1,2)} + p2∙max{C0(ne), max{C0((I(1,2)*AVG).F), C0((AVG.INC*I(2,2)).F)} + C0(mult)} = p1∙max{15, 1} + p2∙max{15, max{max{C0(I(1,2)), C0(AVG)} + C0(F), max{C0(AVG.INC), C0(I(2,2))} + C0(F)} + C0(mult)} = 15∙p1 + p2∙max{15, max{max{1, C0(AVG)} + C0(F), max{C0(AVG) + C0(INC), 1} + C0(F) + 20} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), max{C0(AVG) + C0(INC), 1} + C0(F) + 20} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), max{ C0(AVG) + C0(INC), 1} + C0(F) + 20}} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), C0(AVG) + C0(INC) + 20 + C0(F)}} = 15∙p1 + p2∙max{15, C0(AVG) + C0(INC) + 20 + C0(F)} = 15∙p1 + p2∙( C0(AVG) + C0(INC) + 20 + C0(F));

Т.о., для F имеем: C0(F) = 15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2 + p2∙C0(F).

C0(F) = (15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2)/(1 – p2).

p1 = 10/19; p2 = 1 – p1 = 9/19;

C0(factorial) = 15 + C0(F);

C0(AVG) = 40;

C0(INC) = 25;

C0(F) = (15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2)/(1 – p2).

C0(F) = 91.597;

Ответ: C0(factorial) = 106.597.

Сложность последовательного выполнения предлагается вычислить самостоятельно.

2. Целенаправленные эквивалентные преобразования функциональных программ

При разработке функциональной программы обычно встает вопрос, каким образом, преобразовывая программу при сохранении ее эквивалентности исходной программе, улучшить ее характеристики (время параллельного выполнения, др.).

В [1] предложена система целенаправленных эквивалентных преобразований функциональных программ по их схемам, которая для ациклических схем (схем, не содержащих рекурсивных определений) позволяет получать эквивалентную схему с минимальным временем параллельного вычисления значений соответствующих ей в интерпретации функций.

При этом принципиальное значение при приведении функциональных схем к оптимальной форме с точки зрения минимизации времени параллельного вычисления значений представленных в интерпретации функций имеет эквивалентность (AB)C = ABC (здесь A, B и C – функциональные термы). Легко показать, что время вычисления значений функций, имеющих функциональную схему справа в этой эквивалентности, не больше времени вычисления значений тех же функций по схеме слева.

Приведем список основных аксиом, используемых для целенаправленных эквивалентных преобразований ФС к виду с минимальным временем параллельного вычисления.

(A  B)C = A  BC;
A(B  C) = AB  AC;
(A B)*C = A*C B*C;
C*(A B) = C*A C*B;
(A B)C = AC BC;
C(A B) = CA CB;
A  (B C) = A  B A  C;
(A B)  C = A C B C;
(AB)*( AC) = A(B*C);
A(id*id) = A*A.

Список литературы:

1) Кутепов В.П. Организация параллельных вычислений на системах. М.: МЭИ, 1988.

Соседние файлы в папке Файлы для подготовки к экзамену

#
28.06.2014122.88 Кб21IBM RS6000 SP и HP(SPP) 9000 (Exemplar).doc
#
28.06.20143.27 Mб23NAMD-BluegeneL.ppt
#
28.06.201486.53 Кб22Анализ вычислительной сложности ФС.doc
#
28.06.2014464.9 Кб25Анализ структурной сложности.doc
#
28.06.20141.26 Mб71Архитектура компьютеров и ВС, принципы параллельного программирования.doc
#
28.06.20141.11 Mб45Лямбда-исчисление.doc
#
28.06.201476.8 Кб25О методах и алгоритмах параллельного решения задач и их характеристиках.doc
#
28.06.201475.26 Кб28Особенности параллелизма.doc