Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный авиационный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ОС_Шеховцов_1.docx

Скачиваний:

Добавлен:

09.11.2019

Размер:

14.73 Mб

Скачать

☆

<<< < Предыдущая 84 85 86 87 88 89 90 91 92 93 94 9596 / 11896 97 98 99 100 101 102 103 104 105 106 107 108 > Следующая >>>

20.2.4. Обробка помилок і координація в розподілених системах

Як бачимо, технологія RPC - це прозорий для користувача спосіб перетворення локальних програм у розподілені. Деякі реалізації RPC дають змогу для розв'язання цієї задачі обмежитися мінімальними змінами програмного коду. Виникає запитання: чи завжди коректний такий «автоматичний» підхід? Під час вивчення цього розділу побачимо, що це далеко не так. Можна сказати, що рівень абстракції, наданий RPC, не завжди відповідає специфіці розподілених систем.

Це пов'язано з тим, що структура застосувань, розроблених із використанням RPC, розрахована на роботу за умов успішного функціонування мережі, при цьому обробку помилок виконують майже так само, як і для локальних застосувань. Віддалена процедура, подібно до локальної, повертає простий код помилки («ме-режна помилка», «немає зв'язку» тощо), при цьому немає можливості дослідити, які компоненти розподіленої системи виявилися джерелом проблеми.

Насправді помилки в розподілених системах значно відрізняються за своїм характером від локальних помилок, оскільки їхнім джерелом є взаємодія цілого набору ненадійних компонентів (мережних з'єднань, проміжних вузлів тощо). Крім того, можлива поява часткових помилок, за яких деяку частину дій виконують коректно, а якусь - ні.

Сформулюємо головне правило обробки помилок у розподіленій системі, що не виконується у разі використання RPC: поведінка розподіленої системи при виникненні помилок має бути досліджена так само ретельно, як і коректна поведінка системи. У цьому пункті розглянемо деякі особливості такої поведінки і способи її дослідження. Докладніше про це питання у [45].

Задача розподіленої координації

Цю задачу формулюють так: чи можливо надійно скоординувати дії на двох різних комп'ютерах (наприклад, виконання деякого коду в один і той самий час, виконання дії тільки один раз, атомарну зміну стану на двох різних машинах тощо)?

До дій, що вимагають такої синхронізації, належать, наприклад:

♦ атомарне переміщення файла із сервера S_{ на сервер S<i,

♦ атомарне переміщення суми грошей із рахунку в одному банку на рахунок в іншому.

Головна проблема, що виникає при цьому, пов'язана з тим, що мережа, яка зв'язує ці комп'ютери, є ненадійною:

♦ повідомлення можуть бути втрачені;

♦ комп'ютери можуть бути вимкнені або вийти з ладу.

З урахуванням ненадійності мережі можна уточнити формулювання цієї задачі.

Чи можна використати обмін повідомленнями через ненадійну мережу для надійної синхронізації двох комп'ютерів (щоб вони гарантовано могли виконувати ту саму операцію одночасно)?

Відповідь на це запитання є однозначно негативною навіть тоді, коли всі повідомлення будуть доставлені й жоден комп'ютер не вийде з ладу.

Цю проблему звичайно ілюструють парадоксом візантійських генералів. Припустимо, що два генерали на чолі армій перебувають на деякій відстані один від одного, тому вони можуть обмінюватися повідомленнями тільки через посильних, причому під час доставлення повідомлення посильних можуть полонити. Задачею є погодити час одночасної атаки на ворога (спільних сил достатньо для перемоги, сил кожної армії окремо - ні). Розглянемо протокол обміну повідомленнями, який можна використати в даному випадку.

1. Генерал G_A відсилає повідомлення М_м із точним часом атаки.

2. Генерал G_B отримує М_АІ, відсилає своє повідомлення М_ВІ із висловленням згоди і починає очікувати підтвердження отримання М_ВІ.

3. Генерал G_A отримує М_ВІ, відсилає підтвердження його отримання (М_А2) і починає очікувати підтвердження отримання М_А2.

Подібний обмін повідомленнями може тривати нескінченно. Очевидно, що погодити час атаки генералам не вдасться (останнє повідомлення увесь час залишатиметься непідтвердженим). Доведено, що розв'язків ця задача не має.

Далі в цьому пункті розглянемо протоколи розподіленої координації, що не потребують одночасного виконання операцій різними сторонами.

Протокол запиту-квітування

Проаналізуємо особливості обміну повідомленнями в мережі за наявності помилок. Припустимо, що трапляються тільки помилки передавання даних (втрати повідомлень), учасники протоколу не виходять із ладу.

Для обміну повідомленнями за таких умов із гарантією одноразового доставлення призначений протокол запиту-квітування (request/acknowledge protocol).

1. Відправник пересилає одержувачеві повідомлення і встановлює таймер.

2. Одержувач отримує повідомлення і відсилає підтвердження отримання.

3. Відправник отримує підтвердження і скидає значення таймера.

4. У разі вичерпання часу, заданого таймером, кроки протоколу повторюють.

Цей протокол гарантує, що повідомлення буде доставлене хоча б один раз за

умови, що учасники не виходять із ладу. При цьому одержувач може отримати повідомлення кілька разів (у разі втрати підтвердження). Щоб мати можливість відкидати дублікати, повідомлення можна супроводжувати унікальними номерами.

Протокол запиту-квітування мало пристосований до роботи за умов виходу з ладу його учасників. Наприклад, у разі краху відправника після відновлення він не може отримати інформацію про те, отримав одержувач повідомлення чи ні (підтвердження до нього дійти не зможе). У разі краху одержувача значно ускладнюється робота із дублікатами.

Для координації взаємодії ненадійних учасників потрібні більш складні протоколи. Одним із них є протокол двофазового підтвердження.

Двофазове підтвердження

Оскільки одночасного виконання дій на віддалених комп'ютерах відповідно до парадоксу генералів домогтися неможливо, для розподіленої координації дій використовують методи, у яких допустиме виконання дій у різний час. Розглянемо один із них - двофазове підтвердження (two-phase commit, 2РС) [4].

У цьому разі дві сторони виконують дії, оформлені у вигляді транзакцій -атомарних операцій, які виконуються повністю (підтверджуються, commit) або не виконуються зовсім (відкочуються, rollback).

Прикладом розподіленої транзакції може бути перенесення файла із сервера Si на сервер S₂. Якщо виконання цієї дії переривається, за відсутності атомарності може виявитися, що файл був вилучений із сервера 5_Ь але при цьому не був перенесений на сервер S₂.

Для виконання протоколу двофазового підтвердження необхідно на кожному комп'ютері підтримувати журнал транзакцій (transaction log), у якому відстежу-вати, відбулося підтвердження чи ні. Крім того, один із вузлів мережі має відігравати роль координатора транзакцій. Основним завданням такого координатора є збереження атомарності кожної транзакції у розподіленій системі.

Першим етапом протоколу є етап запитів координатора.

1. Координатор відсилає всім учасникам запит. Він містить опис дії, яка має виконуватися, наприклад «вилучити файл a.txt із кореневого каталогу». Перед відсиланням запиту інформацію про нього зберігають у журналі транзакцій координатора.

2. Учасники отримують запит і виконують транзакцію локально (наприклад, намагаються вилучити файл). Інформацію про результат цієї дії відображають у вигляді повідомлення (М_ок - успіх, М_АВ0КГ - невдача), яке зберігають у журналі транзакцій кожного учасника і відсилають координаторові. Цей етап завершений, коли координатор отримає повідомлення від всіх учасників (або мине максимальний час очікування). Зазначимо, що для жодної транзакції в конкретний момент ще не було виконано ні підтвердження, ні відкату (наприклад, інформацію про вилучення файла зберігають лише у пам'яті). Другим етапом є етап ухвалення рішення координатором.

3. Спочатку координатор ухвалює рішення щодо підтвердження або відкату розподіленої транзакції. На цьому кроці можуть виникнути дві ситуації:

♦ координатор отримує повідомлення M_AB₀_RT хоча б від одного учасника. Після цього він створює повідомлення M_GL₀_BAL rollback зберігає його в журналі та відсилає всім учасникам;

♦ координатор отримує повідомлення М_ок від кожного учасника. Після цього він створює повідомлення M_GL₀_BALC₀_MMIT, зберігає його в журналі та відсилає всім учасникам.

4. Після отримання повідомлення від координатора кожен учасник зберігає його у своєму журналі та виконує відкат або підтвердження транзакції залежно від типу повідомлення. Для цього прикладу відкат може зводитися до повного скасування операції вилучення файла, підтвердження - до вилучення файла з диска.

Розглянемо виконання цього протоколу за умов мережних помилок. Спочатку зупинимося на випадках виходу з ладу учасників протоколу.

♦ Якщо учасник вийде з ладу на кроці 2 (під час виконання транзакції), координатор не отримає повідомлення про завершення транзакції упродовж максимального часу очікування і відкотить транзакцію, відіславши учасникам повідомлення M_GL₀_BAL_{_}_R₀_LLBACK -

♦ Якщо координатор вийде з ладу на кроці 3, після відновлення він має звернутися до свого журналу транзакцій. Коли в ньому немає жодного повідомлення Mglobal_xxx або є повідомлення M_GL₀_BAL_{_}_rollback, то всім учасникам відсилають повідомлення про відкат. Коли в журналі є M_GL₀_BAL_{_}_commit, учасникам відсилають повідомлення про підтвердження.

♦ У разі виходу учасника з ладу на кроці 4 після відновлення він має звернутися до координатора за інформацією і виконати відповідно підтвердження або відкат.

До недоліків протоколу 2РС належать високі вимоги до надійності координатора. Якщо він вийде з ладу на кроці 3 і не відновить свою роботу, всі учасники можуть бути заблоковані.

Це, однак, відбувається не завжди. У разі отримання деякими учасниками повідомлення від координатора на кроці 4, а деякими — ні, часом є можливість завершити транзакцію, звернувшись за інформацією до інших учасників.

♦ Коли хоча б один із учасників отримав Mglobal_xxx, необхідно виконати дію, що відповідає цьому повідомленню.

♦ Коли хоча б один із учасників відіслав M_AB₀_RT, транзакцію необхідно відкотити.

Якщо ж всі учасники відіслали М_ок, але ніхто з них не отримав Mglobal _xxx, рішення не може бути прийнято, оскільки координатор міг зберегти в журналі (але не встиг відіслати) Mglobal_ rollback через свою внутрішню помилку. Така ситуація і спричиняє блокування всіх уч асників. Під час реалізації 2РС потрібно завжди враховувати можливість такого блокування.

<<< < Предыдущая 84 85 86 87 88 89 90 91 92 93 94 9596 / 11896 97 98 99 100 101 102 103 104 105 106 107 108 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.05.2019724.99 Кб2Организация баз данных (Курс лекций).doc
#
19.12.2018542.72 Кб18оригинал курсовой_2003.doc
#
20.07.201950.18 Кб3орфограми укр.мова.doc
#
20.12.2018514.05 Кб11орфографія.doc
#
23.11.2019232.96 Кб3ОС - Модуль - Часть 1.doc
#
09.11.201914.73 Mб74ОС_Шеховцов_1.docx
#
19.08.2019104.45 Кб3Основи адм. права.doc
#
05.09.20194.82 Mб71Основи теорії кіл, частина І, курс лекцій.doc
#
05.09.20196.54 Mб44Основи теорії кіл, частина ІІ, курс лекцій.doc
#
05.09.20192.66 Mб25Основи теорії кіл, частина ІІІ, курс лекцій.doc
#
07.05.2019171.01 Кб1Основи теорії права.doc