- •Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет»
- •2. Последовательные алгоритмы
- •2.1 Строковый
- •2.2 Столбцовый
- •3. Параллельные алгоритмы
- •3.1 Строковый параллельный
- •3.2 Столбцовый параллельный
- •4.Таблицы эффективности
- •4.1 Общее время работы
- •4.2 Относительный прирост от многопоточности
- •4.3 Эффективность использования вычислителей
- •4.4 Время на системе с 4 физическими вычислителями и общей памятью
- •5.Заключение
4.3 Эффективность использования вычислителей
|
Строчный Х2 |
Строчный Х4 |
Строчный Х6 |
Стоблцов ый Х2 |
Стоблцов ый Х4 |
Стоблцов ый Х6 |
1000х1000 |
0,9375 |
0,8652 |
0,5768 |
0,52 |
0,2877 |
0,2301 |
2000х2000 |
0,989 |
0,853 |
0,978 |
0,511 |
0,4345 |
0,3123 |
3000х3000 |
0.9955 |
0.9175 |
0.937 |
0.5 |
0.446 |
0.338 |
4000х4000 |
0.972 |
0.9745 |
0.973 |
0,491 |
0.452 |
0.3925 |
5000х5000 |
0.9825 |
0.982 |
0.981 |
0,4835 |
0.4855 |
0.4353 |
4.4 Время на системе с 4 физическими вычислителями и общей памятью
|
1000х1000 |
2000х2000 |
3000х3000 |
4000х4000 |
5000х5000 |
Строковый последова-тельный |
0,0104 |
0,0421 |
0,0956 |
0,1694 |
0,2658 |
Столбцовый последова-тельный |
0,0053 |
0,0216 |
0,0491 |
0,0866 |
0,1346 |
Строковый параллельный Х2 |
0,0051 |
0,0207 |
0,0456 |
0,0812 |
0,1302 |
Строковый параллельный Х4 |
0,0028 |
0,0106 |
0,0231 |
0,0413 |
0,0956 |
Столбцовый Параллельный Х2 |
0,0071 |
0,0416 |
0,0995 |
0,1479 |
0,2493 |
Столбцовый Параллельный Х4 |
0,0051 |
0,0182 |
0,0478 |
0,0752 |
0,1536 |
5.Заключение
Использование строчного алгоритма позволяет значительно лучше использовать имеющиеся ресурсы. Так, для сравнения, столбцовый алгоритм использует лишь около 50 % мощности вычислителей, в то время как у строчного этот показатель стремится к 100 % . Интересно, что запуск столбцового алгоритма на 2 процессорах в имеющемся оборудовании дает отрицательный прирост производительности при возрастающих размерах матрицы, что полностью лишает смысла использование такого варианта вычислений. Из сравнения с временем выполнения на другой машине виден прирост в последовательном алгоритме за счет более высокой мощности одного вычислителя, однако параллельные алгоритмы выполняются медленнее.