Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эксплуатация СВТ / ЛекЭСВТ_Ч2нов.doc
Скачиваний:
100
Добавлен:
02.06.2015
Размер:
785.92 Кб
Скачать

Сбор и анализ информации о сбоях и отказах компьютеров

Для повышения эффективности обслуживания ЭВМ, особенно сетей ЭВМ предусматриваются средства автоматического накопления информации об ошибках при работе ВС с целью получения статистики ошибок для выявления наиболее вероятных источников ошибок, помех, ненадежных узлов, а также для локализации причин случайных сбоев и перемежающихся отказов.

Для автоматического накопления информации об ошибках в составе ОС предусмотрены специальные средства регистрации и обработки различных типов ошибок в специальных системных журналах ошибок (обычно это область памяти на резидентном магнитном диске).

Для обработки ошибок используются следующие программные средства:

  • обработчик машинных ошибок;

  • обработчик интерфейсных ошибок;

  • регистраторы сбоев и отказов ПУ;

  • регистратор перезагрузок ОС;

  • регистратор программных ошибок;

  • регистратор реконфигураций.

Обработчики машинных и интерфейсных ошибокпредназначены для обработки информации об ошибках, обнаруженных схемами контроля.

При этом в системном журнале осуществляется регистрация состояния устройства, в котором система контроля обнаружила ошибку и производится попытка восстановления вычислительного процесса.

Сначала ошибки регистрируются в отдельной области ОП или специальном быстродействующем буфере памяти, а затем переписывается в системный журнал ошибок на магнитный диск.

В дальнейшем информация из системного журнала ошибок может переписываться на магнитные ленты "накопление" и "истории" для исключения потери информации и ее накопления за большой период времени эксплуатации.

Регистраторы выполняют функции определения статистики о сбоях и отказах в различных устройствах, например:

  • сбоев для каждого ПУ;

  • информации о неисправимых ошибках в ПУ;

  • информации о случаях динамической реконфигурации устройств и т.д.

  • о причине перезагрузки ОС, так как перезагрузка ОС равносильна по своим последствиям отказу системы, причинами которой могут быть:

  • неисправность питания;

  • ошибки системных программ;

  • ошибки аппаратуры;

  • ошибки носителя данных;

  • ненормальное завершение начальной загрузки;

  • ошибки оператора;

  • ошибки в программах пользователя и другие.

Программные средства обработки ошибок включают два режимаиспользования зарегистрированной информации об ошибках: независимую и системную программы, включающие модули накопления и сортировки информации об ошибках, редактирования и печати.

Системные программыобрабатывают информацию из журнала ошибок с резидентного диска и позволяют получить статистику об ошибках только за последний период времени, а также копируют содержимое системного журнала на сменный магнитный носитель (магнитную ленту).

Независимая программаработает с лентами "истории" и " накопления".

Результатом работы данных программ является:

  • обобщенная и систематизированная информация о сбоях и отказах:

  • за заданный интервал времени;

  • по периферийным и внешним устройствам;

  • распечатку по типам записей;

  • распечатку истории сбоев и отказов за заданный промежуток времени с краткой характеристикой задания, порта ПУ, команды, на которой произошла ошибка, а также действий системы и т.д.

Все эти данные используются в дальнейшем для:

  • усовершенствования ЭВМ;

  • проведения мероприятий по повышению качества и эффективности обслуживания;

  • создания банка симптомов ошибок.

Соседние файлы в папке Эксплуатация СВТ