Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
БЖД / Дипломный проект Калинин Е.А. 10.05.11 (финал).doc
Скачиваний:
78
Добавлен:
19.03.2015
Размер:
2.33 Mб
Скачать

3.4.1 Объяснение значений параметров тестового по.

np (number of processes) - параметр shmemrun, число запускаемых процессов;

u (unit) - единицы измерения длины сообщений; возможные значения: b (байты), K (килобайты), M (мегабайты);

m (minimum) - начальная (наименьшая) длина сообщения (здесь и далее все размеры указываются в единицах);

M (Maximum) - наибольшая длина сообщения;

s (step) - шаг увеличения длины сообщения (в случае использования множителя K шаг не используется);

K (coeficient) - множитель для увеличения длины сообщения (обычно используются значения 2 или 10);

R (repeat) - число глобальных повторов (итераций) всего теста;

T (Times) - число итераций в каждой тестовой процедуре;

f (fix time) - этот параметр используется для увеличения числа итераций T, если общее время работы всех итераций тестовой процедуры меньше, чем f (задается в тысячных долях микросекунды).

H (Head) - указывает номер головного процесса; по умолчанию, головным является нулевой процесс;

b (buffer) - размер буфера shmem, дополнительно выделяемого с помощью shmem_Buffer_attach(). В большинстве случаев тест работает без дополнительного буфера.

P (Print mode) - режим вывода результатов; значение "time" соответствует выдачи времени (в микросекундах), а значение "rate" (по умолчанию) - скорости (в Мбайт/сек).

q (quiet) - флаг отключения дополнительной информации, будут печататься только результаты тестов;

o (output) - имя файла, в который будут печататься результаты (по умолчанию, результаты печатаются на терминал).

Пример запуска:

shmemrun -np 4 transf2 uK m1 M1024 K2 T10 f100 R2 otransfer.dat

Тест двунаправленных обменов с помощью shmem_Sendrecv будет запущен на 32 процессорах. В данном случае, в качестве единицы длины сообщения выбирается Кбайт (uK), длина сообщений увеличивается в геометрической прогрессии (K2) от 1 Кбайта (m1) до 1 Мбайта (M1024). По умолчанию, каждая тестовая процедура будет повторяться 10 раз (T10), но это количество будет увеличено, если общее время меньше, чем 0.1 сек (f100). Полностью тест будет повторен 2 раза (R2). Результаты будут записываться в файл transfer.dat в текущей директории (otransfer.dat).

Глава 4. Экспериментальные исследования

В данной главе приведены результаты экспериментальных исследований пропускной способности коммуникационной среды, полученных при помощи тестового программного обеспечения на блоке суперкомпьютера «ЭСК-Е» с конфигурацией:

Процессор – Intel Xeon C5500, 2.0 ГГц 32шт

ОЗУ 512Гб

Общий объем ПЗУ 16ТБ

Для того, что бы оценить эффективность принятых в данном дипломном проекте технических решений, необходимо провести экспериментальное исследование пропускной способности коммуникационной среды PCI Express таблица 4.1. Такое исследование было проведено с помощью вышеописанного программного обеспечения.

Таблица 4.1

Размер, Мбайт

Звезда

Звезда 2

Полный граф

Полный граф 2

Кольцо

Кольцо 2

1

7,26

13,55

13,99

17,73

14,98

15,02

2

9,10

17,21

17,25

19,20

16,65

17,46

4

11,24

19,22

19,95

23,98

23,33

24,10

8

12,14

19,88

23,05

27,66

25,40

26,90

16

13,39

20,05

25,14

28,12

30,00

31,50

1

7,22

13,30

13,95

18,02

14,98

15,04

2

9,28

16,59

17,12

19,31

16,55

17,29

4

11,66

19,22

19,90

24,03

22,49

23,92

8

12,65

19,87

22,47

27,92

25,45

26,80

16

13,45

19,95

25,08

28,22

30,01

31,04

Лучшая пропускная способность коммуникационной среды PCI-Express, результаты в Гбит/c таблица 4.2, рисунок 4.1

Таблица 4.2

Звезда

Звезда 2

Полный граф

Полный граф 2

Кольцо

Кольцо 2

13,39

20,05

25,14

28,22

30,01

31,50

Рисунок 4.1 Лучшие показатели пропускной способности в различных топологиях

Объем

пересылаемого

пакета

1мб

2мб

4мб

8мб

16мб

Рисунок 4.2. Пропускная способность топологии звезда и звезда 2

Объем

пересылаемого

пакета

1мб

2мб

4мб

8мб

16мб

Рисунок 4.3. Пропускная способность топологии полный граф и полный граф 2

Объем

пересылаемого

пакета

1мб

2мб

4мб

8мб

16мб

Рисунок 4.4. Пропускная способность топологии кольцо и кольцо 2

На основе разработанной программы и представленных в графическом виде результатов тестирования, можно сделать вывод о её работоспособности. Была определена максимальная пропускная способность в одну и обе стороны на 4х канальном PCI для разных топологий коммуникационной среды. Лучший результат был достигнут на топологии КОЛЬЦО 2 (пересылка пакета 16мб в обе стороны коммуникационной среды) который соответствует 31,5Гбит/c.

Соседние файлы в папке БЖД