- •Содержание
- •Глава 1. Обзор литературы и постановка задачи 8
- •1.4 Модели программирования 41
- •6.4.10 Мероприятия и средства по защите окружающей среды 103
- •Введение
- •Глава 1. Обзор литературы и постановка задачи
- •1.1 Высокопроизводительные вычисления
- •1.2 Архитектура суперкомпьютеров.
- •1.2.1 Коммуникационные среды.
- •1.2.2 Топология соединительной сети суперкомпьютеров
- •1.2.3 Обзор коммуникационных сред
- •1.3. Программное обеспечение
- •1.3.1 Классификация ос
- •1.3.2Компиляторы
- •1.3.3 Компилятор gnu Compiler Collection
- •1.3.6 Библиотеки для программирования параллельных вычислений.
- •1.3.7 Библиотеки программирования вMpi,cudAиshmem.
- •1.4 Модели программирования
- •1.4.1 Модель передачи сообщенийMpi
- •1.4.2 ТехнологияOpenMp
- •1.4.3 Технология: shmem.
- •1.5 Постановка задачи.
- •Глава 2. Разработка Алгоритма тестирования
- •2.1 Алгоритм теста латентности и коммуникационной производительности.
- •2.2. Блок схема алгоритма
- •Глава 3. Разработка программного обеспечения
- •3.1 Описание и состав суперкомпьютера «эск-е»
- •3.2 Функциональная схема коммуникационной среды.
- •3.3 Основная конфигурацияPci
- •Коммуникационная среда pci Express
- •3.4 Текст программы
- •3.4.1 Объяснение значений параметров тестового по.
- •Глава 4. Экспериментальные исследования
- •Глава 5. Организационно – экономическая часть.
- •5.1. Технико-экономическое обоснование объекта проектирования.
- •5.2. Состав конструкторской группы и их должностные оклады.
- •5.3. Перечень этапов опытно-конструкторских работ при разработке программного обеспечения.
- •5.4. Расчёт сметы затрат на окр при разработке программного обеспечения.
- •5.5. Вывод
- •Глава 6. Безопасность и экологичность проектных решений
- •6.1. Цель и решаемые задачи
- •6.2. Опасные и вредные факторы при работе с пэвм
- •6.3. Характеристика объекта исследования
- •6.4. Мероприятия по безопасности труда и сохранению работоспособности.
- •6.4.1. Обеспечение требований эргономики и технической эстетики
- •6.4.1.1. Планировка помещения и размещение оборудования
- •6.4.1.2. Эргономические решения по организации рабочего места пользователя пэвм
- •6.4.1.3. Цветовое оформление помещения
- •6.4.2. Обеспечение оптимальных параметров воздуха рабочих зон
- •6.4.2.1. Нормирование параметров микроклимата
- •6.4.2.2. Нормирование уровней вредных химических веществ
- •6.4.2.3. Нормирование уровней аэроионизации
- •6.4.3. Создание рационального освещения
- •6.4.4 Защита от шума
- •6.4.5 Обеспечение режимов труда и отдыха
- •6.4.6. Обеспечение электробезопасности
- •6.4.7. Защита от статического электричества
- •6.4.8. Обеспечение допустимых уровней электромагнитных полей
- •6.4.9 Обеспечение пожаробезопасности
- •6.4.9.1 Обеспечение безопасной эвакуации персонала
- •6.4.9.2 Средства извещения и сигнализации о пожаре.
- •6.4.9.3 Способы и средства тушения пожара
- •Пути снижения выбросов и токсичности: стимулом к сокращению объёмов предполагается заинтересованность в сокращении расхода топлива.
- •6.4.10.1 Утилизация компьютеров и оргтехники
- •6.5. Инженерные расчеты
- •6.5.1. Расчет эвакуационного выхода.
- •Заключение
3.4.1 Объяснение значений параметров тестового по.
np (number of processes) - параметр shmemrun, число запускаемых процессов;
u (unit) - единицы измерения длины сообщений; возможные значения: b (байты), K (килобайты), M (мегабайты);
m (minimum) - начальная (наименьшая) длина сообщения (здесь и далее все размеры указываются в единицах);
M (Maximum) - наибольшая длина сообщения;
s (step) - шаг увеличения длины сообщения (в случае использования множителя K шаг не используется);
K (coeficient) - множитель для увеличения длины сообщения (обычно используются значения 2 или 10);
R (repeat) - число глобальных повторов (итераций) всего теста;
T (Times) - число итераций в каждой тестовой процедуре;
f (fix time) - этот параметр используется для увеличения числа итераций T, если общее время работы всех итераций тестовой процедуры меньше, чем f (задается в тысячных долях микросекунды).
H (Head) - указывает номер головного процесса; по умолчанию, головным является нулевой процесс;
b (buffer) - размер буфера shmem, дополнительно выделяемого с помощью shmem_Buffer_attach(). В большинстве случаев тест работает без дополнительного буфера.
P (Print mode) - режим вывода результатов; значение "time" соответствует выдачи времени (в микросекундах), а значение "rate" (по умолчанию) - скорости (в Мбайт/сек).
q (quiet) - флаг отключения дополнительной информации, будут печататься только результаты тестов;
o (output) - имя файла, в который будут печататься результаты (по умолчанию, результаты печатаются на терминал).
Пример запуска:
shmemrun -np 4 transf2 uK m1 M1024 K2 T10 f100 R2 otransfer.dat
Тест двунаправленных обменов с помощью shmem_Sendrecv будет запущен на 32 процессорах. В данном случае, в качестве единицы длины сообщения выбирается Кбайт (uK), длина сообщений увеличивается в геометрической прогрессии (K2) от 1 Кбайта (m1) до 1 Мбайта (M1024). По умолчанию, каждая тестовая процедура будет повторяться 10 раз (T10), но это количество будет увеличено, если общее время меньше, чем 0.1 сек (f100). Полностью тест будет повторен 2 раза (R2). Результаты будут записываться в файл transfer.dat в текущей директории (otransfer.dat).
Глава 4. Экспериментальные исследования
В данной главе приведены результаты экспериментальных исследований пропускной способности коммуникационной среды, полученных при помощи тестового программного обеспечения на блоке суперкомпьютера «ЭСК-Е» с конфигурацией:
Процессор – Intel Xeon C5500, 2.0 ГГц 32шт
ОЗУ 512Гб
Общий объем ПЗУ 16ТБ
Для того, что бы оценить эффективность принятых в данном дипломном проекте технических решений, необходимо провести экспериментальное исследование пропускной способности коммуникационной среды PCI Express таблица 4.1. Такое исследование было проведено с помощью вышеописанного программного обеспечения.
Таблица 4.1
Размер, Мбайт |
Звезда |
Звезда 2 |
Полный граф |
Полный граф 2 |
Кольцо |
Кольцо 2 |
1 |
7,26 |
13,55 |
13,99 |
17,73 |
14,98 |
15,02 |
2 |
9,10 |
17,21 |
17,25 |
19,20 |
16,65 |
17,46 |
4 |
11,24 |
19,22 |
19,95 |
23,98 |
23,33 |
24,10 |
8 |
12,14 |
19,88 |
23,05 |
27,66 |
25,40 |
26,90 |
16 |
13,39 |
20,05 |
25,14 |
28,12 |
30,00 |
31,50 |
1 |
7,22 |
13,30 |
13,95 |
18,02 |
14,98 |
15,04 |
2 |
9,28 |
16,59 |
17,12 |
19,31 |
16,55 |
17,29 |
4 |
11,66 |
19,22 |
19,90 |
24,03 |
22,49 |
23,92 |
8 |
12,65 |
19,87 |
22,47 |
27,92 |
25,45 |
26,80 |
16 |
13,45 |
19,95 |
25,08 |
28,22 |
30,01 |
31,04 |
Лучшая пропускная способность коммуникационной среды PCI-Express, результаты в Гбит/c таблица 4.2, рисунок 4.1
Таблица 4.2
Звезда |
Звезда 2 |
Полный граф |
Полный граф 2 |
Кольцо |
Кольцо 2 |
13,39 |
20,05 |
25,14 |
28,22 |
30,01 |
31,50 |
Рисунок 4.1 Лучшие показатели пропускной способности в различных топологиях
Объем
пересылаемого
пакета
1мб
2мб
4мб
8мб
16мб
Рисунок 4.2. Пропускная способность топологии звезда и звезда 2
Объем
пересылаемого
пакета
1мб
2мб
4мб
8мб
16мб
Рисунок 4.3. Пропускная способность топологии полный граф и полный граф 2
Объем
пересылаемого
пакета
1мб
2мб
4мб
8мб
16мб
Рисунок 4.4. Пропускная способность топологии кольцо и кольцо 2
На основе разработанной программы и представленных в графическом виде результатов тестирования, можно сделать вывод о её работоспособности. Была определена максимальная пропускная способность в одну и обе стороны на 4х канальном PCI для разных топологий коммуникационной среды. Лучший результат был достигнут на топологии КОЛЬЦО 2 (пересылка пакета 16мб в обе стороны коммуникационной среды) который соответствует 31,5Гбит/c.