Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

База данных / examen / theme_01_IS

.pdf
Скачиваний:
41
Добавлен:
18.03.2015
Размер:
419.28 Кб
Скачать

Тема 1. Информационные системы и их функции

Создание современных электронных вычислительных машин позволило автоматизировать обработку данных во многих сферах человеческой деятельности. Без современных систем обработки данных трудно представить сегодня передовые производственные технологии, управление экономикой на всех ее уровнях, научные исследования, образование, издательское дело, функционирование средств массовой информации, проведение крупных спортивных состязаний. Значительно расширило сферу применения систем обработки данных появление персональных компьютеров.

Одним из наиболее распространенных классов систем обработки данных являются информационные системы. Хотя на уровне здравого смысла назначение таких систем понятно каждому, для серьезного обсуждения технологий современных информационных систем необходимо более четко определить, в чем заключаются их специфические особенности, чем они отличаются от других систем обработки данных, какие функции они могут выполнять, какими ресурсами они располагают.

1.1. ЧТО ТАКОЕ ИНФОРМАЦИОННАЯ СИСТЕМА

Для обсуждения возможностей современных информационных систем, состояния и перспектив используемых в них информационных технологий необходимо прежде всего понять, что такое информационная система.

Зачем нужны информационные системы. Любой разумный вид деятельности ос-

новывается на информации о свойствах состояния и поведения той части реального мира, с которой связана эта деятельность. Для получения такой информации во многих случаях необходимо регулярно через некоторые интервалы времени проводить натурные измерения (или наблюдения), позволяющие определять характеристики состояния сущностей реального мира и протекающих процессов, соответствующие моментам времени, когда эти измерения производятся.

В других случаях удается воспользоваться «материализованной» информацией, содержащейся в различного рода бумажных документах, отчетах или публикациях, которые также выступают как часть реальности. Требуемую информацию можно извлечь из них путем своего рода «наблюдения».

Однако некоторые натурные измерения или наблюдения могут оказаться неосуществимыми в отведенное для них время в связи с большой трудоемкостью, высокой стоимостью, недоступностью объекта измерения (наблюдения) и по другим причинам.

Значительно сократить объем необходимых натурных измерений позволяет ком-

1

пьютерное моделирование реальности. Если компьютерная модель адекватно (относительно информационных потребностей пользователей) отражает состояние и динамику реальности, то многие необходимые сведения можно получать с помощью такой модели, избегая тем самым натурных измерений, с существенно меньшими затратами времени, а возможно, и при более низкой стоимости. Именно для поддержки таких моделей служит специальный класс систем обработки данных - автоматизированные информационные системы. Заметим, что в ряде публикаций их называют более привычным для современ-

ного читателя термином - компьютерные информационные системы.

Определение понятия «информационная система».

Система - существует много определений понятия "система", но все из них подразумевают единство законов движения (развития) составляющих элементов. Если же мы говорим о системе, построенной человеком, то законы движения должны определяться конкретными целями.

Приведем примеры систем, состоящих из разных элементов и направленных на реализацию разных целей.

Система

 

Элементы системы

Главная цель

 

системы

 

 

 

 

 

 

 

 

 

Организация

 

Люди, оборудование, мате-

Производство товаров

 

 

риалы, здания и др.

 

 

 

 

 

 

 

Компьютер

 

Электронные

и электромеха-

Обработка данных

 

 

нические элементы,

линии

 

 

 

связи и др.

 

 

 

 

 

 

 

 

 

Телекоммуникационная

сис-

Компьютеры,

модемы,

кабе-

Передача информации

тема

 

ли, сетевое

программное

 

 

 

обеспечение и др.

 

 

 

 

 

 

 

Информационная

 

Компьютеры,

компьютерные

Производство профес-

система

 

сети, люди, информационное

сиональной информации

 

 

и программное обеспечение

 

 

 

 

 

 

 

В информатике понятие "система" широко распространено и имеет множество смысловых значений. Чаще всего оно используется применительно к набору технических средств и программ. Системой может называться аппаратная часть компьютера. Системой может также считаться множество программ для решения конкретных прикладных задач, дополненных процедурами ведения документации и управления расчетами.

2

Добавление к понятию "система" слова "информационная" отражает цель ее создания

ифункционирования. Большинство существующих определений трактует понятие информационной системы с функциональной точки зрения, а именно, как систему, предназначенную для сбора, передачи, обработки, хранения и выдачи информации потребителям

исостоящую из следующих основных компонентов: программное обеспечение, информационное обеспечение, технические средства, обслуживающий персонал.

Программное обеспечение при отсутствии информационной модели (в контексте рассматриваемого вопроса) лишено собственных законов развития и является не более чем необходимым инструментом для построения системы. Таким образом, при подобном определении информационной системы в стороне остается направленность этих функций, цели, для достижения которых они осуществляются. Понимая ограниченность подобного определения, мы даем следующее определение информационной системы.

Автоматизированной информационной системой называется комплекс,

включающий вычислительное и коммуникационное оборудование, программное обеспечение, лингвистические средства и информационные ресурсы, а также системный персонал и обеспечивающий поддержку динамической информационной модели некоторой части реального мира для удовлетворения информационных потребностей пользователей.

Часть реального мира, которая моделируется информационной системой, называ-

ется ее предметной областью.

Под динамической моделью здесь понимается изменяемость модели во времени. Это «живая», действующая модель, в которой отображаются изменения, происходящие в предметной области. Такая система должна обладать памятью, позволяющей ей сохранять не только сведения о текущем состоянии предметной области, но и в некоторых случаях предысторию.

Поскольку модель предметной области, поддерживаемая информационной системой, материализуется в форме организованных необходимым образом информационных ресурсов, она называется информационной моделью.

Приведем пример информационной модели организации учебного процесса вуза (взгляд проректора по учебной работе)

Компоненты (подсистемы) модели:

организационная структура вуза;

кадровый состав вуза (преподаватели);

состав обучающихся;

аудиторный фонд вуза;

3

учебный план специальностей. Используя данную модель можно получить,

расписания занятий студентов, занятости преподавателей и аудиторий;

расчет нагрузки преподавателей;

распределение учебной нагрузки по кафедрам, факультетам и в целом по ВУЗу;

информация о факультете: какие специальности выпускает, какие группы студентов обучаются, какие кафедры принадлежат факультету;

информация по кафедре: какие дисциплины преподаются, какие преподаватели работают на кафедре, какие аудитории закреплены за кафедрой.

Автоматизированная информационная система не всегда функционирует самостоятельно. Она может входить в качестве компонента (подсистемы) в более сложную систему, такую, например, как система управления торговой компанией, САПР или система управления производством.

Информационные системы уже многие десятки и даже сотни лет существуют и используются на практике в форме различного рода картотек и/или коллекций бумажных документов. Однако в таких системах отсутствует какая-либо автоматизация обработки данных. Они позволяют лишь регистрировать и поддерживать в систематизированной форме на бумажных носителях результаты произведенных натурных измерений.

Нас будут интересовать только автоматизированные информационные системы, то есть системы, основанные на использовании средств вычислительной техники и программного обеспечения, и далее мы будем опускать для краткости прилагательное «автоматизированная».

Приведенное выше определение охватывает информационные системы всех видов,

в частности фактографические системы, которые основаны на технологиях баз данных

иоперируют структурированными данными, системы текстового поиска, оперирующие документами на естественных языках, глобальную гипермедийную информационную систему Web и др. По этой причине в определении используется обобщенный термин информационные ресурсы. Частными его случаями являются данные для систем баз данных, документы для систем текстового поиска, HTML-страницы или ХМL-документы для Web

ит.д.

Нужно, однако, заметить, что на более низких уровнях представления (в памяти компьютеров, при передаче по каналам связи и т.д.) информационные ресурсы независимо от их природы и формы представления рассматриваются как хранимые или передаваемые данные. Термин «данные» часто используется по отношению к информационным ресурсам любого рода.

4

Ресурсы информационных систем. Информационные системы используют ресурсы нескольких категорий - средства вычислительной техники, системное и прикладное программное обеспечение, информационные, лингвистические и человеческие ресурсы. Кроме того, хотя об этом не говорится в известных определениях автоматизированных информационных систем, но подразумевается как само собой разумеющееся, для функционирования системы необходимы и другие ресурсы - помещения, их техническое оснащение, всевозможная оргтехника, электроснабжение и т.д. В нашем случае мы их рассматривать не будем, поскольку они не имеют непосредственного отношения к информационным технологиям.

Информационные системы могут базироваться на различных аппаратных платформах - персональных компьютерах, мейнфреймах, суперкомпьютерах и других вычислительных системах. Они могут использовать отдельные компьютеры или вычислительные системы либо вычислительные сети различного масштаба - от локальной до глобальной сети. В информационных системах могут использоваться наряду с универсальными также и специализированные компьютеры, например, так называемые машины баз данных, аппаратным путем реализующие некоторые функции реляционной алгебры.

Коммуникационное оборудование в информационных системах обеспечивает взаимодействие компонентов распределенных систем, например обмен данными между компьютерами сети, а также удаленный доступ пользователей к ресурсам системы. К числу коммуникационных ресурсов относятся выделенные или коммутируемые проводные и беспроводные каналы связи, различное сетевое оборудование, а также устройства приемапередачи информации, например телефонные или радиомодемы, антенные устройства.

Системное программное обеспечение включает операционные системы для используемых аппаратных платформ, различные операционные оболочки, повышающие уровень пользовательского интерфейса, системы программирования, разнообразные системные тесты, служебные программы для поддержки деятельности системного администратора и для других целей, сетевое программное обеспечение.

Информационные системы используют также разнообразное прикладное программное обеспечение, типовое и специализированное.

Типовое прикладное программное обеспечение ориентировано на классы задач.

Оно может настраиваться на конкретный случай использования. Чаще всего в качестве таких средств используются коммерческие программные продукты: СУБД общего назначения, Web-серверы, системы текстового поиска (их по традиции часто называют инфор- мационно-поисковыми системами), системы управления документами, текстовые процессоры, конверторы данных, программы распознавания текста и речи, системы электронных

5

таблиц, генераторы отчетов для систем баз данных и др.

Специализированное прикладное программное обеспечение создается для кон-

кретной информационной системы или для класса систем, имеющих некоторое узкое назначение. Например, в корпоративной информационной системе это могут быть программы, предназначенные для поддержки каких-либо конкретных бизнес-процессов.

Прикладное программное обеспечение информационных систем может относиться к стадии разработки или к стадии исполнения. Оно может быть общего назначения или ориентированным на конкретную предметную область. Наконец, программное обеспечение может быть ориентированным на конкретную аппаратную платформу или мобильным.

Лингвистические ресурсы информационных систем служат для:

представления информационных ресурсов в системе;

описания их свойств и свойств окружающей среды, позволяющего системе адекватно интерпретировать поддерживаемые информационные ресурсы;

обеспечения взаимодействия пользователей с системой.

Вобщем случае к числу лингвистических ресурсов относятся те или иные естественные или искусственные языки, а также средства их лингвистической поддержки - словари лексики естественных языков, тезаурусы предметной области, переводные словари и др.

Информационные ресурсы системы составляют главный компонент модели предметной области, которую система поддерживает. Они являются одновременно и «сырьем»

и«конечным продуктом» работы информационной системы. Конкретный вид информационных ресурсов зависит от характера системы.

Важно заметить, что в любой информационной системе поддерживается две категории информационных ресурсов. Ресурсы первой категории непосредственно используются конечными пользователями системы. Ресурсы второй категории можно было бы назвать метаресурсами. Описывая свойства ресурсов первой категории, они позволяют системе корректно оперировать ими. Как уже отмечалось, ресурсы первой категории часто называют данными независимо от среды их представления (изображения, текстовые документы, аудиозаписи и т.д.), а метаресурсы - метаданными.

Используя эту терминологию, можно сказать, что метаданные - это данные о данных. Однако фактически метаданные могут описывать свойства не только собственно данных, но и информационной системы в целом, отдельных ее механизмов и их функций, других ее ресурсов, поддерживаемых технологий, пользователей и т.д. Конкретные функции метаданных и их состав в значительной мере зависят от специфики рассматриваемой

6

системы и характера конкретных информационных ресурсов.

Уместно вспомнить, что данные в информационной системе представляют собой некоторую абстрактную модель реальности. Рассматривая соотношение между данными и метаданными, можно сказать, что метаданные - это данные более высокого уровня абстракции по отношению к описываемым ими данным.

Необходимая степень формализованности представления метаданных в информационной системе зависит от характера их использования. Метаданные, предназначенные для компьютерного использования, представляются в формализованном виде. Если же они предназначены для пользователей, то чаще всего представляются на естественном языке.

Вернемся теперь к информационным ресурсам информационных систем раз-

личных классов.

Всистемах, основанных на технологиях баз данных, поддерживаются структурированные данные, организованные в виде таблиц или каких-либо иных структур данных.

Кинформационным ресурсам систем баз данных относятся также и схемы баз данных. В таких системах они относятся к категории метаданных.

Втекстовых системах информационные ресурсы включают коллекции документов, представленных на естественных языках. Это информационные ресурсы для конечных пользователей. Кроме того, поддерживаются метаданные - тезаурусы, спецификации онтологий и т.п., которые являются информационными ресурсами, используемыми самой системой.

Пользовательские информационные ресурсы в Web - это страницы Web-сайтов, ресурсы «скрытого» Web - базы данных, а также различные доступные пользователям Webдокументы, представленные в форматах, отличных от HTML. В Web нового поколения к информационным ресурсам, кроме того, относятся не только представленные на Webсайтах XML-документы, но и различные метаданные. Они описывают схемы XMLдокументов, их семантику, онтологии.

Пользователи информационной системы. Важно уточнить, как трактуется поня-

тие пользователь в контексте рассмотрения технологий информационных систем. Прежде всего, к числу пользователей информационных систем относятся специа-

листы в предметной области системы, для удовлетворения информационных потребностей которых система создается. Пользователей этой категории называют конечными пользователями.

Будем считать, что пользователями системы являются не только конечные пользователи, но и программные средства приложений, применяющие информационные ресурсы

7

данной информационной системы для решения собственных задач.

В некоторых информационных системах контингент пользователей не зафиксирован. Информационные ресурсы таких систем свободно предоставляются любому пользователю. В других системах для того, чтобы стать пользователем, необходимо получить от системного администратора требуемые полномочия доступа к системе, а иногда и к некоторым ее информационным ресурсам.

1.2. МОДЕЛИРОВАНИЕ РЕАЛЬНОСТИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

Важную роль в моделировании предметной области информационной системы играют ее информационные ресурсы. Во всех классах моделей, рассматриваемых ниже, кроме случая темпоральных баз данных, информационные ресурсы системы представляют статическую модель предметной области, характеризуя ее текущее состояние. Темпоральные базы данных позволяют представлять динамику предметной области - изменение ее состояния во времени.

Природа моделей предметной области, поддерживаемых в информационных системах, может быть различной. С технологической точки зрения наиболее существенны различия подходов к моделированию предметной области по степени структурированности ее представлений, которую они обеспечивают.

Используемые в настоящее время подходы к моделированию предметной области в информационных системах охватывают следующий спектр возможностей.

Структурированные модели. Модели такого рода основаны на выявлении регулярной структуры предметной области. Для конструирования таких моделей нужно типизировать сущности предметной области, относя к одному типу сущности с одинаковым набором свойств. Аналогичным образом типизируются связи между сущностями. Связи определяются на множествах типов сущностей и могут иметь различную арность. Например, связи могут быть бинарными или n-арными. Представление предметной области, сконструированное с помощью рассматриваемого подхода, также называется структури-

рованным.

При использовании структурированных моделей представление предметной области имеет два уровня. Представление более высокого уровня абстракции - это модель предметной области, отображающая ее свойства, инвариантные во времени. Эта модель представляется в терминах типов сущностей предметной области и типов связей между ними. Такую модель называют интенсионалом предметной области. Второй, более конкретный уровень, моделирует состояние предметной области в зависимости от времени.

8

Модель этого уровня представляется в терминах конкретных экземпляров сущностей и связей определенных типов между ними. Эту модель называют экстенсионалом предмет-

ной области.

На структурированных моделях предметной области с регулярной структурой основаны системы баз данных. В этом случае интенсионал предметной области называют схемой базы данных. Естественно называть информационные ресурсы систем баз данных

структурированными данными.

Слабоструктурированные модели. При создании некоторых информационных систем применяется подход к моделированию предметной области, при котором регуляр-

ная ее структура не определена или она не существует в рассматриваемом случае. Такой подход используется, например, в системах, основанных на различного рода языках разметки.

В рассматриваемом подходе не предусматривается строгая типизация сущностей предметной области и связей между сущностями. Представление предметной области обычно является одноуровневым. Поддерживается экстенсионал предметной области - ее представление в терминах конкретных экземпляров сущностей и связей между ними. Иногда предпринимается попытка некоторой типизации сущностей и связей. Но не гарантируется, что свойства типов обязательно присущи всем относящимся к ним экземплярам. Определенный в таком случае интенсионал, по аналогии с системами баз данных иногда называемый схемой, не играет директивной роли. Конкретные экземпляры сущностей и связей, свойства которых не соответствуют схеме, системой не отвергаются.

Такого рода представления предметной области называют слабоструктурированными. Информационные ресурсы систем, основанных на рассматриваемом подходе, назы-

вают слабоструктурированными данными.

Наиболее известной информационной системой, в которой поддерживается слабоструктурированное представление предметной области, является глобальная распределенная гипермедийная информационная система World Wide Web (далее - Web), базирующаяся на технологиях HTML.

Формирующийся в настоящее время Web нового поколения, основанный на технологической платформе XML, позволяет поддерживать не только слабоструктурированные, но и структурированные представления предметной области.

Формальные модели. Такие модели связаны с подходом к моделированию предметной области информационной системы, основанным на использовании формальных языков. Как и в случае структурированных моделей, здесь определена регулярная структура предметной области, но для модельного ее представления используются формаль-

9

ные языки. Формальное представление предметной области, как и в случае структурированных моделей, является двухуровневым. Оно включает интенсионал и экстенсионал предметной области. Интенсионал представляет собой набор аксиом, описывающий соотношения между его элементами - типами сущностей и связей. В данном контексте они представляются как предметные переменные.

Экстенсионал предметной области представляется в данном случае в виде совокупности фактов.

Для создания формальных моделей обычно используются различные языки представления знаний, чаще всего языки логики первого порядка. В последнее время стала применяться их разновидность - языки логик описаний.

Рассматриваемый подход позволяет осуществлять логический вывод, и пользователь может получать при обращении к системе новые факты, которые непосредственно в явном виде в ней не были представлены. Такие интеллектуальные информационные системы являются представителями класса систем, основанных на знаниях. Они весьма близки по своим возможностям к системам баз знаний, экспертным системам и т.д.

Неструктурированные модели. К этой категории относятся вербальные модели,

то есть модели, описывающие реальность в виде текстов на естественном языке. В таких моделях явным образом не представляется структура предметной области - множество сущностей, их свойств, различного рода связей между этими сущностями, интересующих пользователей системы. Эта структура может быть реконструирована на основе анализа содержания заданных текстов, однако, не всегда однозначным образом. Автоматизация такого анализа - достаточно сложная задача, связанная с технологиями обработки естест-

венного языка (Natural Language Processing).

Существует широкий спектр информационных систем, поддерживающих неструктурированные модели предметной области. В простейших из них задачи анализа и понимания естественного языка возлагаются на пользователя. В продвинутых системах большая часть нагрузки, связанной с решением этих задач, возлагается на систему.

Здесь уместно вспомнить об интенсионале предметной области. В системах рассматриваемого класса он может быть материализован в форме тезауруса, описания онтологии предметной области и других инструментов, которые относятся к средствам лингвистической поддержки системы. В простейших системах он явно не представлен в системе и ей не доступен. Он существует только в интеллектуальном багаже пользователя. Что касается упоминавшихся продвинутых систем, то их возможности по работе с содержанием поддерживаемых в системе документов основаны именно на интенсиональной модели предметной области, явным образом представленной в системе.

10

Соседние файлы в папке examen