Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы АСУ_Конспект лекций_2009.doc
Скачиваний:
9
Добавлен:
16.11.2019
Размер:
1.07 Mб
Скачать

Активность данных.

Активность данных - это характеристика, определяемая отношением числа обращений к структурному элементу данных к общему числу обращений к информации (базе данных, файлу) в некоторый интервал времени или единицу работы.

Активность поля - это отношение числа обращений к полю в пределах одной записи к числу обращений к полям записи.

где Rj - активность поля j,

kj - количество обращений к полю j,

ki - количество обращений к полю i,

1 =< i <= n, n - число полей записи.

Обычно активные поля располагают ближе к началу записи.

Аналогично определяется активность файла (базы):

Активность файла (базы) - это отношение числа обращений к файлу (базе) к числу обращений к совокупности файлов (баз).

Активные файлы располагают на магнитном диске ближе к его центру.

Принцип размещения данных в структуре пространства - активные данные располагают так, чтобы легче и быстрее взять, а неактивные - можно подальше.

Важное значение характеристики активности имеют для систем оперативного доступа к информации, для систем с использованием транзакций. Под транзакцией понимается единица работы в вычислительной системе, включающей в свой состав запрос, обработку данных и ответ на запрос.

Выборочность обработки данных.

Коэффициент выборочности данных - это отношение количества обработанных записей (Na) к числу всех записей (N).

Кв = Na/N

Если коэффициент выборочности близок к 0, низкий, то используют прямые методы доступа, если к 1, то последовательные методы доступа (сплошная выборка).

Изменчивость данных.

Изменчивость данных - это характеристика количества изменений базы данных (файла) за некоторый интервал времени.

Изменчивые (динамичные) файлы - это файлы, данные в которых часто меняются.

Статичные (постоянные, условно-постоянные) файлы - это файлы, данные в которых редко меняются.

Примером постоянных файлов могут служить: классификаторы, номенклаторы, справочники различных коэффициентов и некоторые другие файлы нормативно-справочной информации (НСИ).

Избыточность данных.

Избыточность (дублирование) - это характеристика, определяемая отношением количества дублированных (повторившихся) данных (Vd) ко всему объему данных (V).

Kd = Vd/V

Чем ближе Kd к 0, тем лучше.

В рассмотренном выше примере данных об узлах и деталях, представленных двумя структурами данных - линейной и иерархической, хорошо иллюстрируется дублирование данных в линейной структуре (дублируются значения поля “узел” для разных деталей, входящих в один узел). В иерархической структуре дублирование полей отсутствует.

Банк данных.

Определение банка данных из ОРММ ГКНТ (1982г):

Банк данных - это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных”.

Принципы банка данных.

- независимость данных;

- неизбыточность данных;

- универсальность;

- совместимость;

- защита данных;

- управление одновременной работой;

- поддержка распределенной системы баз данных.

Не рассматривая подробно, приведем определение указанных выше принципов.

Под независимостью данных понимается такой принцип построения структуры данных и их размещения в системе, реализации программных, технических, организационных элементов информационной системы, который обеспечивает минимум затрат при внесении различных изменений в систему в течение ее жизненного цикла. Одним из основных средств обеспечения независимости данных является применение систем управления базами данных (СУБД) при разработке ИС.

Обычно выделяют два вида независимости данных - логическую и физическую. Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения действующих прикладных программ. Например, могут быть добавлены в логическую структуру новые группы данных (сегменты, агрегаты), установлены дополнительные связи между данными и т.п. Физическая независимость данных означает, что физическое расположение и организация данных могут изменяться, но при этом логическая структура данных, программы не изменяются. Например, может быть изменен тип носителя информации (физическое устройство), метод доступа (индексно-последовательный на прямой и т.п.), размещение информации на носителе и так далее. Независимость данных обеспечивает эволюцию информационной системы при совершенствовании технических, программных, информационных средств.

Другими словами, независимость данных - это свойство системы, дающее возможность изменять логическую и физическую структуру данных без изменения при этом прикладных программ.

Неизбыточность данных - это свойство системы, позволяющее вводить и хранить данные один раз с оптимальным использованием в различных приложениях. Под избыточностью понимается использование одного и того же экземпляра данного в разных структурах данных (файлах, базах), что при изменении данного приведет к необходимости изменять экземпляры данных во всех структурах, где эти данные встречаются, и что приводит к дополнительным затратам. При этом дублирование (копирование) информации для сохранения и восстановления данных не относится к понятию избыточности данных. При разработке ИС в ряде случаев, обусловленных техническими или экономическими причинами, приходится идти на определенный компромисс и допускать избыточность данных в некоторой минимальной степени.

Универсальность - это свойство системы поддерживать и отображать в структуре данных возможно максимальный круг объектов, процессов, явлений.

Совместимость - это свойство системы обеспечивать преемственность более поздних версий системы по отношению к ранее созданным информационным фондам, а также наличие интерфейсов для приема/передачи данных в другие информационные системы.

Защита данных - это свойство системы, обеспечивающее защиту данных от разрушений (аппаратных и программных сбоев, физического разрушения и т.д.) и несанкционированного доступа.

Управление одновременной работой - это свойство системы обеспечить согласованное параллельное выполнение нескольких процессов обработки данных для различных пользователей.

Поддержка распределенной системы баз данных - это способность системы обрабатывать территориально разнесенную информацию (в разных местах и в различных вычислительных системах) как единую взаимосвязанную совокупность данных.