Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Файлы для подготовки к экзамену / Анализ вычислительной сложности ФС

.doc
Скачиваний:
22
Добавлен:
28.06.2014
Размер:
86.53 Кб
Скачать

5

Анализ вычислительной сложности ФС и их целенаправленные эквивалентные преобразования

Методы оценки вычислительной сложности позволяют получить числовые характеристики сложности параллельного выполнения ФС программ по сложностным оценкам элементарных функций, используемым при их написании.

Исчисление эквивалентности ФС программ дает возможность осуществлять их целенаправленные эквивалентные преобразования. Целью таких преобразований может быть улучшение некоторых качеств программы, например, времени параллельного выполнения.

1. Анализ вычислительной сложности функциональных программ

Практический интерес представляет возможность получения точных оценок времени параллельного выполнения функциональных программ (ФП) при достаточно общих предположениях: известных данных о времени выполнения элементарных функций в ФП и вероятности осуществления (неосуществления) условных переходов в ней.

В [1] разработана формальная система, позволяющая определять время параллельного вычисления значений функций по заданным характеристикам временной сложности элементарных функций, входящих в представление функции, и вероятностям осуществления условных переходов.

Пусть задана функциональная схема (ФС) Xi = ti, i = 1, 2, … ,n; F = {fi | i = 1, 2, …, k} – множество всех входящих в термы ti, i = 1, 2, …, n, базисных функций.

В [1] показано, что термы ti в задании ФС могут быть представлены в эквивалентной форме ti = ti1  ti2  …  tik, i = 1, 2, …, n, где каждый терм tij не содержит операции ортогонального объединения  и все термы попарно ортогональны.

Пусть C(R) – функция, определяющая сложность параллельного вычисления значения функции R.

Для любой базисной функции fi предполагается, что C(fi) задано и представляет собой некоторое действительное число. Также предполагается, что на области определения DR интересующей функции R для каждого терма tij в описанном выше ее представлении задана вероятность qij того, что именно его значение будет определено при вычислении значения ti(d) для dDR. Эта вероятность напрямую связана в общем случае с условием, определяющим выполнение этого события. Также должно выполняться естественное требование для любого i.

При этих условиях сложность параллельного вычисления значения функций Xi в задании ФС может быть определена следующим образом [1].

По заданию ФС последовательно вычисляются «приближения» фиксированной точки для Xi согласно известной процедуре [1]:

Xi(0) =  (нигде неопределенная функция),

Xi(k+1) = [Xj(k)/Xj | j = 1, 2, …, n]ti, i = 1, 2, …, n, k>=0. Здесь [Xj(k)/Xj | j = 1, 2, …, n]ti есть результат одновременной подстановки переменных Xj(k) вместо всех вхождений Xj в терм ti.

Очевидно, терм в правой части приближения Xj(k) не содержит функциональной переменной Xi. После его приведения к указанной выше эквивалентной форме, согласно [2], его вычислительная сложность определяется индукцией по построению:

C(fi) = ti (время вычисления значения базисной функции fi)

C(tt) = max{C(t) , C(t)}

C(tt) = max{C(t) , C(t)}

C(tt) = C(t) + C(t)

Зная в ортогональном представлении Xi(k) = ti1(k)ti2(k) . ..tivi(k) вероятности qij, i, j = 1, 2, …, vi, того, что при вычислении значения Xi(k)(d) будет определено tij(k)(d) = d (остальные значения tit(k)(d), it  ij, будут не определены в силу того, что функции tij(k), i = 1, 2, …, vi попарно ортогональны) можно считать, что среднее время вычисления Xi(k)(d) для любого d из области определения Ximin (минимальной фиксированной точки для Xi) равно .

Более точно, эта формула есть промежуточный шаг в определении среднего времени вычисления Ximin при применении Ximin к любому элементу из области ее определения.

Среднее время параллельного вычисления значений функции Ximin определяется как Ci(Xi (kmin)) для минимального значения k = kmin такого, что |Ci(Xi(k)) - Ci(Xi(k+1))|  , где заданная  – точность вычисления среднего значения.

Описанная итеративная процедура вычисления среднего времени параллельного вычисления значений функций сходится [1]. Вместо нее можно применять другой, точный метод вычисления среднего значения, который сводится к решению множества систем линейных уравнений, построенных по ФС, в которых в качестве неизвестных выступают средние времена сложности C(Xi) параллельных вычислений значений функций Xi в задании ФС. Рассмотрим этот метод на примерах.

Пример 1. Вычисление факториала.

Scheme factorial

{

factorial = (id*<0>).eq -> <1> + (id*<0>).ne -> (id * (id*<1>).minus.@) . mult;

}

Зададим оценки сложности выполнения элементарных функций:

Элементарная функция F

Сложность элементарной функции C(F)

id

15

const

5

eq

15

ne

15

minus

10

mult

20

Пусть p1 – вероятность выполнения левой ветви, p2 – вероятность выполнения правой ветви. Понятно, что p1 + p2 = 1. Отметим, что в нашем случае, p1 = 1/(n + 1).

Вычислим сложность данной ФС при параллельном выполнении:

C0(factorial) = p1∙C0((id*<0>).eq  <1>) + p2∙C0((id*<0>).ne  (id*(id*<1>).minus. factorial).mult) = p1∙max{C0((id*<0>).eq), C(<1>)} + p2∙max{C0((id*<0>).ne), C0(id*(id*<1>).minus. factorial) + C0(mult)} = p1∙max{C0(id*<0>) + C0(eq), C0(<1>)} + p2∙max{C0(id*<0>) + C0(ne), C0(id*(id*<1>).minus) + C0(factorial) + C0(mult)} = p1∙max{max{C0(id), C0(<0>)} + C0(eq), C0(<1>)} + p2∙max{max{C0(id), C0(<0>)} + C0(ne), C0(id*(id*<1>)) + C0(minus) + C0(factorial) + C0(mult)} = p1∙max{max{15, 5} + 15, 5} + p2∙max{max{15, 5} + 15, max{C0(id), C0(id*<1>)} + C0(minus) + C0(factorial) + C0(mult)} = p1∙max{30, 5} + p2∙max{30, max{15, max{C0(id), C0(<1>)} + C0(minus) +C0(factorial) + C0(mult)} = 30∙p1 + p2∙max{30, max{15, max{15, 5} + 10 + C0(factorial) + 20} = 30∙p1 + p2*max{30, max{15, 15 + 10 + C0(factorial) + 20}} = 30∙p1 + p2∙max{30, 45 + C0(factorial)} = 30∙p1 +p2∙(45 + C0(factorial)).

Т.о., имеем: C0(factorial) = 30∙p1 + 45∙p2 + p2∙C0(factorial). Откуда получаем: C0(factorial) = (30∙p1 + 45∙p2)/(1 – p2). При p1 = 0.1 и p2 = 0.9 получаем сложность параллельного выполнения C0(factorial) = 435.

Вычислим, далее, сложность ФС при последовательном выполнении:

C1(factorial) = p1∙C1((id*<0>).eq  <1>) + p2∙C1((id*<0>).ne  (id*(id*<1>).minus. factorial).mult) = p1∙(C1((id*<0>).eq) + C1(<1>)) + p2∙(C1((id*<0>).ne) + C1((id*(id*<1>).minus. factorial).mult)) = p1∙(C1(id*<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id*<0>) + C1(ne) + C1(id*(id*<1>).minus. factorial)) + C1(mult)) = p1∙(C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id) + C1(<0>) + C1(ne) + C1(id*(id*<1>).minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙(C1(id) + C1(<0>) + C1(ne) + C1(id*(id*<1>)) + C1(minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙( C1(id) + C1(<0>) + C1(ne) + C1(id) + C1(id*<1>) + C1(minus) + C1(factorial) + C1(mult)) = p1∙( C1(id) + C1(<0>) + C1(eq) + C1(<1>)) + p2∙( C1(id) + C1(<0>) + C1(ne) + C1(id) + C1(id) + C1(<1>) + C1(minus) + C1(factorial) + C1(mult)) = p1∙(15 + 5 + 15 + 5) + p2∙(15 + 5 + 15 + 15 + 15 + 5 + 10 + C1(factorial) + 20) = 40∙p1 + p2∙(100 + C1(factorial)).

Т.о., имеем: C1(factorial) = 40∙p1 + 100∙p2 + p2∙C1(factorial). Откуда получаем: C1(factorial) = (40∙p1 + 100∙p2)/(1 – p2). При p1 = 0.1 и p2 = 0.9 получаем сложность последовательного выполнения C1(factorial) = 940

Ответ: C0(factorial) = 435, C1(factorial) = 940 (при заданных значениях сложностей элементарных функций и вероятностей условных переходов).

В приведенном примере рассматриваемая ФС состояла из одного функционального уравнения. Далее рассмотрим пример ФС, состоящей из нескольких функциональных уравнений.

Пример 2. Вычисление факториала методом “разделяй и властвуй”.

Scheme factorial

{

factorial = (<1>*id).F;

F = eq -> I(1,2) + ne -> ((I(1,2)*AVG).F * (AVG.INC * I(2,2)).F).mult;

AVG = (plus*<2>).div.round;

INC = (id*<1>).plus;

}

Зададим оценки сложности выполнения элементарных функций:

Элементарная функция F

Сложность элементарной функции C(F)

id

15

const

5

eq

15

ne

15

I

1

mult

20

plus

10

div

20

round

10

Вычислим сложность данной ФС при параллельном выполнении:

C0(factorial) = C0((<1>*id).F);

C0(F) = p1∙C0(eq  I(1,2)) + p2∙C0(ne  ((I(1,2)*AVG).F*(AVG.INC*I(2,2)).F).mult);

C0(AVG) = C0((plus*<2>).div.round);

C0(INC) = C0((id*<1>).plus);

p1 и p2 во втором уравнении – вероятности выполнения левой и правой ветвей в условном переходе (в определении F) соответственно.

C0(factorial) = C0(<1>*id) + C0(F) = max{C0(<1>), C0(id)} + C0(F) = max{5, 15} + C0(F) = 15 + C0(F);

C0(AVG) = C0((plus*<2>).div) + C0(round) = C0(plus*<2>) + C0(div) + C0(round) = max{C0(plus), C0(<2>)} + C0(div) + C0(round) = max{10, 5} + 20 + 10 = 40;

C0(INC) = C0(id*<1>) + C0(plus) = max{C0(id), C0(<1>)} + C0(plus) = max{15, 5} + 10 = 25;

C0(F) = p1∙max{C0(eq), C0(I(1,2)} + p2∙max{C0(ne), max{C0((I(1,2)*AVG).F), C0((AVG.INC*I(2,2)).F)} + C0(mult)} = p1∙max{15, 1} + p2∙max{15, max{max{C0(I(1,2)), C0(AVG)} + C0(F), max{C0(AVG.INC), C0(I(2,2))} + C0(F)} + C0(mult)} = 15∙p1 + p2∙max{15, max{max{1, C0(AVG)} + C0(F), max{C0(AVG) + C0(INC), 1} + C0(F) + 20} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), max{C0(AVG) + C0(INC), 1} + C0(F) + 20} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), max{ C0(AVG) + C0(INC), 1} + C0(F) + 20}} = 15∙p1 + p2∙max{15, max{C0(AVG) + C0(F), C0(AVG) + C0(INC) + 20 + C0(F)}} = 15∙p1 + p2∙max{15, C0(AVG) + C0(INC) + 20 + C0(F)} = 15∙p1 + p2∙( C0(AVG) + C0(INC) + 20 + C0(F));

Т.о., для F имеем: C0(F) = 15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2 + p2∙C0(F).

C0(F) = (15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2)/(1 – p2).

p1 = 10/19; p2 = 1 – p1 = 9/19;

C0(factorial) = 15 + C0(F);

C0(AVG) = 40;

C0(INC) = 25;

C0(F) = (15∙p1 + (C0(AVG) + C0(INC) + 20)∙p2)/(1 – p2).

C0(F) = 91.597;

Ответ: C0(factorial) = 106.597.

Сложность последовательного выполнения предлагается вычислить самостоятельно.

2. Целенаправленные эквивалентные преобразования функциональных программ

При разработке функциональной программы обычно встает вопрос, каким образом, преобразовывая программу при сохранении ее эквивалентности исходной программе, улучшить ее характеристики (время параллельного выполнения, др.).

В [1] предложена система целенаправленных эквивалентных преобразований функциональных программ по их схемам, которая для ациклических схем (схем, не содержащих рекурсивных определений) позволяет получать эквивалентную схему с минимальным временем параллельного вычисления значений соответствующих ей в интерпретации функций.

При этом принципиальное значение при приведении функциональных схем к оптимальной форме с точки зрения минимизации времени параллельного вычисления значений представленных в интерпретации функций имеет эквивалентность (AB)C = ABC (здесь A, B и C – функциональные термы). Легко показать, что время вычисления значений функций, имеющих функциональную схему справа в этой эквивалентности, не больше времени вычисления значений тех же функций по схеме слева.

Приведем список основных аксиом, используемых для целенаправленных эквивалентных преобразований ФС к виду с минимальным временем параллельного вычисления.

  1. (A  B)C = A  BC;

  2. A(B  C) = AB  AC;

  3. (A B)*C = A*C B*C;

  4. C*(A B) = C*A C*B;

  5. (A B)C = AC BC;

  6. C(A B) = CA CB;

  7. A  (B C) = A  B A  C;

  8. (A B)  C = A C B C;

  9. (AB)*( AC) = A(B*C);

  10. A(id*id) = A*A.

Список литературы:

1) Кутепов В.П. Организация параллельных вычислений на системах. М.: МЭИ, 1988.