- •Предисловие
- •1. Основы информационного обеспечения процессов и систем
- •1.1. Понятие и содержание информационного обеспечения
- •1.2. Структура и классификация информационных систем
- •1.3. Система представления и обработки данных фактографических аис
- •Вопросы и упражнения
- •2. Системы управления базами данных фактографических информационных систем
- •2.1. Функции, классификация и структура субд
- •2.2. Модели организации данных
- •2.2.1. Иерархическая и сетевая модели организации данных
- •2.2.2. Реляционная модель организации данных
- •2.3. Внутренняя схема баз данных фактографических аис
- •2.3.1. Физические структуры данных
- •2.3.2. Индексирование данных
- •2.3.3. Расстановка (хеширование) записей
- •Вопросы и упражнения
- •3. Основы создания автоматизированных информационных систем
- •3.1. Общие положения по созданию автоматизированных систем
- •3.2. Проектирование банков данных фактографических аис
- •3.2.1. Концептуальное проектирование
- •3.2.2. Проектирование схем реляционных баз данных
- •3.2.2.1. Проектирование и создание таблиц
- •3.2.2.2. Нормализация таблиц
- •Вопросы и упражнения
- •4. Ввод, обработка и вывод данных в фактографических аис
- •4.1. Языки баз данных
- •4.2. Ввод, загрузка и редактирование данных
- •4.2.1. Ввод и редактирование данных в реляционных субд
- •4.2.2. Особенности ввода и загрузки данных в субд с сетевой моделью организации данных
- •4.3. Обработка данных
- •4.3.1. Поиск, фильтрация и сортировка данных
- •4.3.2. Запросы в реляционных субд
- •4.3.2.1. Запросы на выборку данных
- •4.3.2.1.1. Запросы на выборку данных из одной таблицы
- •4.3.2.1.2. Запросы на выборку данных из нескольких таблиц
- •4.3.2.1.3. Вычисления и групповые операции в запросах
- •4.3.2.2. Запросы на изменение данных
- •4.3.2.3. Управляющие запросы
- •4.3.2.4. Подчиненные (сложные) запросы
- •4.3.2.5. Оптимизация запросов
- •4.3.3. Процедуры, правила (триггеры) и события в базах данных
- •4.3.4. Особенности обработки данных в субд с сетевой моделью организации данных
- •4.4. Вывод данных
- •Вопросы и упражнения
- •5. Распределенные информационные системы
- •5.1. Понятие распределенных информационных систем, принципы их создания и функционирования
- •5.2. Технологии и модели «Клиент-сервер»
- •5.2.1. Модель файлового сервера
- •5.2.2. Модель удаленного доступа к данным
- •5.2.3. Модель сервера базы данных
- •5.2.4. Модель сервера приложений
- •5.2.5. Мониторы транзакций
- •5.3. Технологии объектного связывания данных
- •5.4. Технологии реплицирования данных
- •Вопросы и упражнения
- •6. Документальные информационные системы
- •6.1. Общая характеристика и виды документальных информационных систем
- •6.2. Информационно-поисковые каталоги и тезаурусы
- •6.2.1. Классификационные системы поиска документов
- •6.2.2. Координация понятий в классификационных системах
- •6.2.3. Информационно-поисковые тезаурусы
- •6.2.4. Автоматизация индексирования документов
- •6.3. Полнотекстовые информационно-поисковые системы
- •6.3.1. Информационно-технологическая структура полнотекстовых ипс
- •6.3.2. Механизмы поиска документов в полнотекстовых ипс
- •6.3.3. Методы количественной оценки релевантности документов
- •6.4. Гипертекстовые информационно-поисковые системы
- •6.4.1. Гипертекст
- •6.4.2. Структура, принципы построения и использования гипертекстовых ипс
- •6.4.3. Модель организации данных в гипертекстовых ипс
- •6.4.4. Формирование связей документов в гипертекстовых ипс
- •Вопросы и упражнения
- •7. Администрирование информационных систем и защита данных
- •7.1. Администрирование информационных систем
- •7.2. Разграничение доступа и защита данных
- •7.2.1. Понятие и модели безопасности данных
- •7.2.2. Технологические аспекты защиты информации
- •7.2.2.1. Идентификация и аутентификация
- •7.2.2.2. Языки безопасности баз данных
- •7.2.2.3. Безопасность повторного использования объектов
- •7.2.2.4. Надежное проектирование и администрирование
- •7.2.3. Требования и классы защищенности автоматизированных (информационных) систем в «Руководящих документах...» Государственной технической комиссии при Президенте рф
- •Вопросы и упражнения
- •Литература
- •Алфавитно-предметный указатель Содержание
3.2. Проектирование банков данных фактографических аис
Одной из наиболее трудоемких и сложных задач при создании АИС является проектирование банка данных как основы подсистемы представления и обработки информации. Логическая и физическая структуры банка данных отражают представление разработчиками и пользователями информационной системы той предметной области, сведения о которой предполагается отражать и использовать в АИС.
Проектирование банков данных фактографических информационных систем осуществляется на основе формализации структуры и процессов предметной области АИС, и, в соответствии с уровнями представления информации в АИС (см. рис. 1.3), включает концептуальное(пп. 3.1 и 4.1) исхемно-структурноепроектирование (п. 5.1).
В организационном плане в группе разработчиков банка данных выделяют специалистов по формализации предметной области, специалистов по программному обеспечению СУБД, а также технических дизайнеров и специалистов по эргономике. Специалисты no формализации предметной области(их еще называют формализаторами или постановщиками задач), как правило, возглавляют весь проект создания АИС и обеспечивают (функции взaимодейcтвия с заказчиком. К данной категории специалистов предъявляются наиболее сложные профессиональные требования. С одной стороны, такие работники должны быть специалистами в севере программного обеспечения АИС (операционные системы, СУБД и т. д.), а с другой стороны, они должны хорошо представлять (или освоить) конкретную предметную область АИС, т. е. быть (временно стать) бухгалтерами, экономистами, делопроизводителями и т.п.Специалисты по программному обеспечению СУБДотносятся к категории профессиональных программистов, определяют выбор СУБД и обеспечивают построение ее средствами автоматизированного банка данных по разработанной постановщиком задачи (формализатором) концептуальной схеме.Технические дизайнерыиcneциaлисты по эргономикеобеспечивают эстетичную и эргономичную сторону интерфейса с пользователем в АИС при вводе, обработке и поиске данных.
3.2.1. Концептуальное проектирование
Концептуальное проектирование банков данных АИС является в значительной степени эвристическимпроцессом, и адекватность построенной в его рамках инфологической схемы предметной области проверяется в большинстве случаев эмпирически по анализу и проверке удовлетворения информационных потребностей пользователей для решения задач АИС.
В процедуре концептуального проектирования можно выделить следующие этапы:
• обзор и изучение области использования АИС для формирования общего представления о предметной области;
• формирование и анализ круга функций и задач АИС;
• определение основных объектов-сущностей предметной области и отношений между ними;
• формализованное описание предметной области. Обзор и изучение области использования АИС для формирования общего представления о предметной области осуществляется разработчиком в непосредственном взаимодействии с заказчиком. Разработчиком при этом изучается также и необходимая организационно-распорядительная документация — положения, уставы, инструкции, функциональные обязанности и т.п. На этой основе определяются основные процессы, участники и информационные потоки в предметной области АИС. Принципиальным моментом для фактографических АИС являетсяфрагментирование предметной области,т. с. ее разделение на организационные, технологические, функциональные или иные фрагменты. При этом формализатору необходимо прояснить ряд вопросов и решить следующие задачи:
• выделить перечень фрагментов (лица, принимающие решения на различных уровнях организационной иерархии, функционально-технологические структуры, подразделения и т. п.), подлежащих охвату, т. е. информационному отражению в АИС;
• определить информационные потребности и информационные результаты деятельности каждого фрагмента (какая информация, в каком виде, в какие сроки и т. п.);
• определить общие характеристики и содержание процессов потребления и обработки информации в каждом фрагменте (содержание информации, технология ее обработки, передачи, использования и т.д.).
Ответы на эти вопросы помогут сформировать представление о существующей («как есть») технологии формирования, накопления, обработки и использования информациив рамках предметной области АИС и проанализировать совместно с заказчиком«узкие места»инедостаткив существующей технологии.
Проиллюстрируем данный этап проектирования на примере создания банка данных фактографической АИС по учету, контролю, исполнению и прохождению организационно-распорядительных и информационно-справочных документов. Общее знакомство с предметной областью можно получить в беседе с руководителем и работниками службы документационного обеспечения управления (СлДОУ — секретариат, делопроизводство, канцелярия и т. п.) о системе и порядке документооборота в организации. Дополнительно целесообразно также ознакомиться с регламентирующими данный участок работы нормативными документами.*
* В данном случае:
Типовая инструкция по делопроизводству в министерствах и ведомствах Российской Федерации. — М.: Изд-е Комитета по делам архивов при Правительстве Российской Федерации, 1992;
Примерное положение о службе документационного обеспечения управления» (приложение к «Типовой инструкции по делопроизводству...»). — М.: Изд-е Комитета по делам архивов при Правительстве Российской Федерации, 1992;
ГОСТ Р 6.30-97 «Унифицированная Система Организационно-Распорядительной Документации. Требования к оформлению документов».
В результате такого знакомства можно выделить следующие фрагменты предметной области:
• руководители организации; подразделения организации; их руководители; сотрудники, исполняющие документы; мероприятия; документы, обработка которых или подготовка которых реализует управленческие решения и мероприятия;
• служба документационного обеспечения управления; его руководители и работники, ведущие регистрацию, учет, обработку и хранение документов.
Информационные потребности первого фрагмента сводятся к своевременному получению и рассмотрению входящих документов, своевременному получению проектов готовящихся документов для согласования и визирования или принятых внутренних документов для исполнения или использования при организации и проведении различных мероприятий. Кроме того, для первого фрагмента важным является также и получение справочной информации по каким-либо конкретным документам, хранящимся в СлДОУ, поиск нужных документов по реквизитам, тематике, содержанию и т. п.
Информационные потребности второго фрагмента в целом можно охарактеризовать необходимостью организации и контроля всех этапов документооборота в организации (где в данный момент находится конкретный документ, кем завизирован, подписан, утвержден, зарегистрирован, поставлен ли на контроль, исполнен ли, в какое дело приобщен и т. д.).
Характеристики и процессы по документообороту кратко можно выразить следующим образом. Инициирование, подготовка и реализация большинства управленческих решений на различных уровнях организационной иерархии осуществляются на основе использования (руководства), подготовки, принятия и исполнения организационно-распорядительных и информационно-справочных документов. Входящие документы докладываются на решение руководителям организации, которые через резолюции на документах организуют принятие и исполнение необходимых мероприятий. Резолюции на документах доводятся СлДОУ до исполнителей (руководителей) подразделений. Исполнение мероприятия по документу ставится СлДОУ на контроль. Документ после исполнения по решению руководителя может быть уничтожен или приобщен к определенному номенклатурному делу. Внутренние организационно-распорядительные документы (приказы, решения, планы, графики) готовятся в плановом или в инициативном порядке исполнителями из соответствующих подразделений. При этом документ проходит стадию проекта, согласования, утверждения, доведения до исполнителей и исполнения. Для подготовки, принятия и исполнения организационно-распорядительных документов и при проведении различных мероприятий может потребоваться подготовка необходимых информационно-справочных документов (справок, протоколов, отчетов, писем, запросов и т. п.), стадии которых в общем плане могут исключать некоторые стадии организационно-распорядительных документов.
После формирования общего представления о предметной области производится определение круга функций и задач,решение которых предполагается обеспечивать с помощью АИС. Круг функций и задач АИС определяется на основедекомпозиции основной цели создания АИС так называемого «лозунга»)путем формирования последовательно детализируемых способов их решения с учетом существующей технологии накопления и обработки информации и преодоления ее узких мест с помощью АИС. При этом определяется предварительныйперечень пользователейсистемы и уточняютсяих информационные потребности.
В рассмотренном примере с АИС по делопроизводству, очевидно, основной целью (лозунгом) является повышение эффективности управленческих процессов в организации. Решение этой задачи может быть достигнуто через повышение эффективности документооборота путем уменьшения сроков подготовки и прохождения документов, улучшение контроля за исполнением документов, создание эффективной информационно-справочной поддержки для подготовки исполнителями проектов служебных документов. Пользователями АИС, очевидно, должны являться работники СлДОУ, руководители и исполнители документов в подразделениях.
Главным итоговым результатом концептуального проектирования является определение основных объектов-сущностей предметной области и отношений между ними.В большинстве случаев организационные, технологические и прочие отношения предметной области имеют документальное выражение в различного родаорганизационно-распорядительных, информационно-справочных и других нормативно-служебных документах.Поэтому выделение основных информационных объектов-сущностей предметной области начинается с анализа таких документов и регламентации (положения, инструкции, бланки, формализованные карточки и отчеты, формы, журналы и т. п.).
Анализ «бумажной» документации позволяет сформировать перечень атрибутов,характеризующих те или иные объекты-сущности и отношения предметной области. При этом в одном нормативном или служебном документе могут быть отражены атрибуты различных объектов сущностей и отношений. Поэтому можно выделитьдва подходаформирования перечня сущностных объектов предметной области и их атрибутов —дедуктивныйииндуктивный.
В первом подходена основе формирования общего представления о предметной области АИС, функций АИС, а также информационных потребностей основных абонентов-пользователей выделяютсяосновные понятия и категории,которымиоперируют(которыми выражаются)фрагменты предметной области.Данные понятия и категории принимаются за первоначальную основусписка объектов-сущностей предметной области.Далее на основе анализа служебной и технологической документации, а также дополнительного взаимодействия с заказчиком формируютсяатрибуты,характеризующие выделенные объекты-сущности.
При определении перечня атрибутов каждого объекта предметной области, как и самого перечня объектов сущностей, руководствуются соображениями минимальной достаточности,соблюдая знаменитый принцип «бритвы Оккама»* известного английского философа Уильяма Оккама (1285-1349). Иначе говоря, и перечень самих объектов-сущностей и набор их атрибутов долженбыть достаточнымдля решения всех частных задач системы и удовлетворять информационным потребностям абонентов-пользователей системы, но он такжене должен быть избыточным,чтобы минимизировать расходы по накоплению информации и эксплуатации АИС.
* «Не умножай число сущностей без необходимости». См., например, с. 317 в работе: Философский словарь / Под ред. М.Т.Тимофеева, 6-е изд., перераб. и доп.— М.: Политиздат, 1991.
Во втором подходена основе анализа служебной и технологической документации выделяются все необходимые для решения частных задач АИС сведения, их характеристики и параметры, и на этой основе формируетсяобщий перечень атрибутов предметной области.Далее на основе эвристического анализа производится агрегация (группирование) атрибутов в отдельные группы, образующие объекты-сущности предметной области.
Часть атрибутов и понятий предметной области выражают процессы-отношениямежду объектами-сущностями. Такие атрибуты выделяются, и анализируются параметры и характер связей,которые они выражают —структурность, направленность, множественность, обязательностьналичия для экземпляров объектов.
Чаще всего выделение объектов-сущностей, их атрибутов и отношений-связей осуществляется комбинированным способом на итерационной основе,с многократным уточнением исходного списка объектов, агрегацией атрибутов в группы и т. д. Распространенным приемом в этом случае является «обобщение»некоторых понятий и атрибутов. Суть обобщения заключается в объединении в одну сущность близких или однотипных понятий, категорий, атрибутов на основе анализа их частных проявлений и вариантов. К примеру, совокупность понятий «холодильник», «стиральная машина», «телевизор», «пылесос» и т. п. обобщается сущностью «Бытовые электроприборы» с атрибутом «Тип», имеющим соответствующий список значений.
В примере с АИС по делопроизводству на основе предварительного формирования общего представления о предметной области, а также дополнительного изучения документации СлДОУ (структура журналов регистрации и учета документов, порядок ведения номенклатурных дел и т. д.) можно выделить следующие понятия и категории — документ, реквизиты, исполнитель. подготовка, согласование, руководитель, утверждение, подписание, регистрация, доклад документа, резолюция, мероприятия, подразделения, доведение до исполнителей, исполнение документа, контроль исполнения, хранение, уничтожение, выдача, дело в производстве, архивное дело.Часть этих понятий и категорий прямо выражают объекты-сущности (документ), часть выражает атрибуты сущностей (реквизиты документа). Часть понятий (исполнитель, руководитель) можно обобщить одной сущностью (сотрудник). Часть понятий (исполнение, согласование, подписание, утверждение) выражает отношения между сущностями (между документом и сотрудником).
В итоге перечень объектов сущностей предметной области АИС делопроизводства и их атрибутов может быть следующим:*
• Документ (Peг.№, Дата, Название вида, Заголовок к тексту, Гриф, Текст);
• Сотрудник (Таб. №, ФИО, Подразделение, Должность, Кабинет, Телефон);
• Подразделение (№, Наименование);
• Мероприятие (Наименование, Дата начала, Дата окончания, Завершенность);
• Дело (№№, Наименование, Дата начала, Дата окончания, Гриф).
* Данный вариант является исключительно иллюстративно-учебным.
Отношения, которыми охвачены объекты-сущности, можно отобразить следующей таблицей:
Таблица 3.2
Отношения объектов-сущностей предметной области АИС по делопроизводству
Формализованное описание концептуальной схемы банка данныхосуществляется средствами одной изсемантических моделей данных.Семантические модели данных возникли в противовес ограниченности средств и способов выражения смысловой организации связей между таблицами-сущностями в реляционной модели данных. При этом в большинстве случаев семантические модели применяются на стадии концептуального проектирования с последующим преобразованием концептуальной схемы банка данных в структуру соответствующей реляционной базы данных. В этом смысле разработку концептуальной схемы банка данных называют семантическим моделированием данных.
Наиболее популярными являются разновидности уже упоминавшейся ER-модели, использующие для графического представления структуры данных аппарат диаграмм Бахмана. Формализованное описание ER-моделибыло предложено в 1976 году Петером Пин-Шен Ченом.* Основными компонентами структурной составляющей семантической модели Чена являютсясущности, наборы сущностей, атрибуты сущностей, наборы значений атрибутов, ключевые атрибуты сущностей. связи, виды связей, атрибуты связей, наборы связей, ключевые атрибуты связей.**
* Перевод оригинальной статьи П. Чена «Модель «Сущность-Связь» — шаг к единому представлению данных» представлен в журнале СУБД.—№3 — 1995 г. С. 137-157.
** Легко заметить, что семантическая модель Чена является агрегацией и обобщением сетевой и реляционных моделей.
Оригинальные предложения П. Чена по графическому обозначению в диаграммах Бахмана сущностей и связей претерпели изменения, и далее мы будем придерживаться современных вариантов графического изображения концептуальных схем, а именно — объекты-сущности изображать прямоугольниками, при необходимости вставляя в них перечень их атрибутов, связи типа «Один-ко-многим» будем обозначать линиями с парой символов (1 ) на концах соответствующих объектов, связи типа «Миогие-ко-многим» линиями с парой символов () и связи типа «Один-к-одному» линиями с парой символов (1 1). Обязательный характер связи будем обозначать черным квадратиком на конце соответствующей связи, необязательный характер — пустым квадратиком.
В качестве примера на рис. 3.1 приведена концептуальная схема банка данных АИС по делопроизводству.
Формализованное описание концептуальной схемы банка данныхв большинстве случаев осуществляется на бумаге и служит основой эскизного проекта создания банка данныхинформационной системы. Следующим шагом в проектировании является построение средствами СУБД схемы банка (базы) данных, которое в большинстве случаев производится «вручную». Иначе говоря, средствами СУБД, поддерживающей ту или иную модель данных, скажем реляционную, создается структура банка данных, соответствующая концептуальной схеме. При этом при переходе от концептуального к схемно-структурному проектированию может иметься разрыв в семантических средствах выражения сущностей, атрибутов, связей и т. д.Адекватность реализации концептуальной схемы банка данных определяется, как уже отмечалось,эвристическииэмпирическив ходеотладкии дальнейшейэксплуатациибанка данных.
Рис. 3.1. Пример концептуальной схемы банка данных АИС по делопроизводству