Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_ГОС_магистр.doc
Скачиваний:
74
Добавлен:
09.09.2019
Размер:
4.03 Mб
Скачать
  1. Вопросы надежности распределенных информационно-вычислительных систем.

Надежность - свойство системы выполнения функции в заданных условиях функционирования и с заданными показателями качества. Случаются сбои. Надежность - это сложная задача, структурная организация ИВС не сводится к простой традиционной схеме надежности. Из всего набора многообразия выдели только те, связанные с восстановлением процесса вычислений в системе после сбоя и устранения отказа. Отказ может быть прямым (без возврата) и с возвратом.

Прямой - обнаруживаются и ликвидируются. его последствии. Можно только для определения набора заранее предусмотренных сбоев.

Возвратный сбой из некорректного состояния в корректное. Второе является более универсальным и часто используется.

Пример 1. Эффект домино.

В распределенной системе взаимодействуют 3 процесса х, у и z. Вертикальные линии это обозначение моментов, которые соответствует событиям отказов. Если процесс х приостановлен в момент х3, то он может быть восстановлен из состояния х3, без проблем связанных с другими процессами. Если процесс у2 приостановлен после отправки им сообщения М, то он отброшен в состояние у2. В этом случае получение сообщения М будет отмечено в состоянии х3, а посылка не отмечена в у2. В этом случае М - сообщение сирота. Процесс х откатится в х2.

Пример 2. Потеря сообщения.

Рассматриваем два процесса х и у они взаимодействуют друг с другом. Точки фиксации: х1 и у1, в которых происходит откат. Если процесс у приостановлен после получения сообщения М, то этот процесс возвращается в состояние у1 а сообщение М потеряно.

Пример 3. Бесконечное восстановление.

Процесс у приостановлен до получения сообщения М1 у отправляется в точку у1, в которой отсутствуют сведения о сообщении М1, поэтому процесс х должен быть возвращен в точку х1, потому что сообщений об отправке в точке у1 нет. После возврата процесса у в току у1 процесс вновь направляет сообщение из той же точки, но отправляет сообщение М2, в этот момент он получает сообщение-призрак (сообщение Н1). Тогда процесс х после возврата в состояние х1 снова продолжает движение вперед, то есть посылает Н2 и принимает М2, но после возврата уже х не имеет никаких сведений относительно Н1, а Н1 пришло в у. Процесс у должен откатиться назад.

Борьба с этими проблемами производится с пом консистентного множ-ва контрольных точек. Для распред сис запоминание согласованного глобального состояния яв-ся сложной теоретич проблемой, кот может быть решена при исп-и консистентного мн-ва контр точек.

Мн-во контрольных точек строго консистентно, если во время его фиксации не производилось никаких обменов между процессами. Это понятие соответствует понятию строгого консистентного глобального состояния, когда все посланные сообщения получены и нет никаких сообщений в каналах связей.

Мн-во контрольных точек консистентно, если для любой зафиксированной операции приема сообщения соответствующая операция посылки также зафиксирована, т.е. нет сообщений-сирот.

Простой способ фиксации консистентного множества контрольных точек -фиксация локальной контр точки после каждой операции посылки сообщения, при этом посылка сообщения и фиксация должны быть единой неделимой операцией (транзакцией). Множество полученных таким образом точек будет являться консистентным, но не строго консистентным.

Для того, чтобы избежать потерь сообщений при восстановлении, в том случае, если используется консистентное множество контрольных точек, необходимо повторить отправку тех сообщений, квитанции по получению которых стали недействительными в результате возврате контрольной точки.

Используя временные метки можно распознать сообщения-призраки, а также избежать бесконечного восстановления.

Коммутация и синхронизация в распределенных вычислительных системах