1. Види, переваги та недоліки numa-систем

Архітектура з неоднорідним доступом до пам'яті (NUMA - Non-Uniform Memory Access). Система складається з однорідних базових модулів (плат), що складаються з невеликої кількості процесорів і блоку пам'яті. Модулі об'єднані за допомогою високошвидкісного комутатора. Підтримується єдиний адресний простір, апаратно підтримується доступ до віддаленої пам'яті, тобто до пам'яті інших модулів. При цьому доступ до локальної пам'яті в кілька разів швидше, ніж до віддаленої. Кожен модуль досить часто є SMP-системою, яка доповнена спеціальною системою доступу до віддаленої пам'яті. Вперше ідею гібридної архітектури запропонував Стів Волох і втілив в системах серії Exemplar. Варіант Волоха - система, що складається з 8-ми SMP вузлів. Фірма HP купила ідею і реалізувала на суперкомп'ютерах серії SPP. Ідею підхопив Сеймур Крей (Seymour R.Cray) і додав новий елемент - когерентний кеш, створивши так звану архітектуру cc-NUMA (Cache Coherent Non-Uniform Memory Access), яка розшифровується як "неоднорідний доступ до пам'яті із забезпеченням когерентності кешів". Він її реалізував на системах типу Origin. Масштабованість NUMA-систем обмежується обсягом адресного простору, можливостями апаратури підтримки когерентності кешей і можливостями операційної системи з управління великим числом процесорів. На даний момент, максимальне число процесорів в NUMA-системах становить 256 (Origin2000), що набагато більше, ніж можливе число процесорів SMP-систем. Зазвичай вся система працює під управлінням єдиної ОС, як в SMP. Але можливі також варіанти динамічного "підрозділу" системи, коли окремі "розділи" системи працюють під управлінням різних ОС (наприклад, Windows NT і UNIX в NUMA-Q 2000). Операційна система повинна на відміну від SMP враховувати неоднорідність адресного простору для кожного процесора, щоб уникати частого міжмодульного доступу. Модель програмування, повністю аналогічно SMP.

Переваги і недоліки. NUMA-системи за своїми параметрами аналогічні SMP-систем. Її призначення - частково усунути головний недолік SMP - низьку масштабованість. Це досягається за рахунок створення віртуальної загальної пам'яті. Масштабованість виростає на порядок, але за це доводиться платити збільшенням вартості апаратного та програмного забезпечення. Апаратура ускладнюється за рахунок появи єдиного комунікаційного середовища, до якості якого пред'являються високі вимоги. Програмне забезпечення ускладнюється в основному за рахунок необхідності створення нової ОС, що враховує особливості архітектури.

2. Узагальнена передача даних від одного процесу всім процесам.

Узагальнена операція передачі даних від одного процесу до всіх процесів (розподіл даних) відрізняється від широкомовної розсилки тим, що процес передає процесам різні дані (див. рис. 4.4). Виконання даної операції може бути забезпечено за допомогою функції:

int MPI_Scatter(void *sbuf,int scount,MPI_Datatype stype, void *rbuf,int rcount,MPI_Datatype rtype, int root, MPI_Comm comm),

де

sbuf, scount, stype – параметри переданого повідомлення (scount

кількість елементів, переданих на кожний процес), rbuf, rcount, rtype – параметри повідомлення, прийнятого в процесах, root – ранг процесу, що пересилає дані, comm – комунікатор, в межах якого виконується передача даних.

При виклику цієї функції процес з рангом root зробить передачу даних всім іншим процесам в комунікаторі. Кожному процесу буде надіслано scount елементів. Процес з рангом 0 отримає блок даних з sbuf з елементів з індексами від 0 до scount-1, процесу з рангом 1 буде відправлений блок з елементів з індексами від scount до 2 * scount-1 і т.д. Тим самим, загальний розмір повідомлення, що відправляється повинен бути рівний scount * p елементів, де p є кількість процесів в комунікаторі comm. Слід зазначити, оскільки функція MPI_Scatter визначає колективну операцію, виклик цієї функції при виконанні розсилки даних повинен бути забезпечений у кожному процесі комунікатора. Відзначимо також, що функція MPI_Scatter передає всім процесам повідомлення однакового розміру. Виконання більш загального варіанта операції розподілу даних, коли розміри повідомлень для процесів можуть бути різного розміру, забезпечується за допомогою функції MPI_Scatterv.

БІЛЕТ №15

1. Системи з масовою паралельною обробкою MPP.

Рисунок. 3.2. Схематичний вид архітектури з|із| роздільною пам'яттю

Недоліки|нестачі|:

- кожен процесор може використовувати тільки|лише| обмежений об'єм|обсяг| локального банку пам'яті;

<<< < Предыдущая 1 2 34 / 54 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.11.201995.23 Кб4Application of Petroleum Markets to Geochemical...doc
#
18.09.201972.19 Кб4aspi.doc
#
16.11.20191.14 Mб4astronomia.doc
#
17.04.201941.78 Кб1A_b_v.docx
#
29.08.2019353.79 Кб3Basic_Concepts_of_Geology_1-13.doc
#
21.09.2019166.91 Кб1BILET11-15.doc
#
17.04.201968.61 Кб2Bilet25,26 (1).doc
#
21.09.201975.78 Кб4Bilety_21-25.doc
#
17.09.2019556.29 Кб2bleyksli_sandra_ob_intellekte.rtf
#
13.07.2019638.98 Кб19BluePrint.doc
#
05.11.2018727.04 Кб21Business_Engl_A4.doc