Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Kolokvium / ХАНЕНКО2

.DOC
Скачиваний:
27
Добавлен:
19.04.2013
Размер:
71.17 Кб
Скачать

ОСНОВНЫЕ НАПРАВЛЕНИЯ РАЗВИТАЯ ИНФОРМАЦИОННЫХ СИСТЕМ

Новые средства взаимодействия пользователя с информационной системой

К числу наиболее эффективных новых средств, предоставляемых пользователям информационных си­стем современным вычислительным оборудованием, прежде всего следует отнести машинную графику, манипулирование крупноформатными бланками (крупноформатными электронными таблицами), методы обработки текста. Развитию этих средств спо­собствовало появление и широкое внедрение в раз­личные сферы деятельности персональных компьюте­ров (или персональных ЭВМ-ПЭВМ). Как извест­но, первые персональные компьютеры появились в середине 70-х годов. Персональный компьютер пред­ставляет собой небольшую ЭВМ, основой которой яв­ляется микропроцессор. В работах выделяются следующие признаки, позволяющие отнести вычислительную систему к классу персональ­ных компьютеров: сравнительно небольшая стоимость системы; наличие периферийной памяти в виде кас­сетных накопителей на магнитной ленте или магнитных дисках, а также винчестерские диски емкостью от 5 до 50 Мбайт; возможность подключения к вы­числительным сетям и большим ЭВМ; наличие операционной системы, обеспечивающей взаимодействие пользователя и вычислительной системы в режиме диалога и быструю реакцию на запросы или дейст­вия пользователя; использование в качестве языка программирования, по крайней мере, одного языка высокого уровня (БЕЙСИК, ФОРТРАН, КОБОЛ и т. п.), позволяющего не учитывать конкретный ха­рактер машинных операций; гибкость и универсаль­ность вычислительной системы, дающие возмож­ность использовать широкий набор программных средств в различных приложениях (экономические и финансовые операции, научно-технические задачи, управление производством, образование, домашнее хозяйство и т. д.); простота вычислительной системы и ее ориентированность на пользователя-непрограм­миста.

Расширение областей применения, быстрое увели­чение числа пользователей персональных ЭВМ яви­лось следствием как резкого изменения соотношения стоимость-производительность, так и развития воз­можностей ПЭВМ. Персональные компьютеры сейчас могут использоваться не только в режиме самостоя­тельной вычислительной системы, но и как интеллектуальный терминал большой ЭВМ или информационно-вычислительной сети.

Машинная графика. Внедрение ПЭВМ сдела­ло доступными для широкого круга пользователей те эффективные средства визуального представле­ния (визуализации) информации, которые до недавнего времени исполь­зовались в основном работе с супер-ЭВМ. Новые программные продукты позволяют пользоваться графическими средствами (представ­лять данные на экране дисплея в виде различных диаграмм и графиков) даже для сравнительно недорогих компьютеров. При этом достигается весьма высокое качество интерфейса - средств общения между пользователем и ЭВМ, комфортность такого взаимодействия. К таким средствам, прежде всего, относится организация «оконного интерфейса». Этот тип ин­терфейса позволяет разделить экран дисплея на отдельные зоны, которые называют «окнами». Ближайшей аналогией здесь могут служить листы бумаги, расположенные на рабочем столе. Каждое окно слу­жит экраном для отдельной прикладной программы. Пользователь, применяющий оконный интерфейс, мо­жет одновременно выводить на экран дисплея резуль­таты, полученные им на разных этапах работы, пред­ставляя в одних окнах промежуточные значения, в других -необходимую справочную информацию в текстовой форме или исходные данные, в третьих- графическое представление результирующей инфор­мации. Для управления оконным интерфейсом разработаны специальные средства: «мышь», «джойстик» (рычажный указатель) и т.д. Мышь представляет со­бой небольшую коробочку с одной или несколькими кнопками, перемещение которой по рабочему столу или специальному планшету синхронно отображается перемещением курсора (метки) на экране дисплея. Двигая мышь, пользователь может легко переходить от одного окна к другому, анализируя при этом. представленную информацию. Нажатие кнопки озна­чает, что мышь, а следовательно, и курсор, попали в нужное окно, которое фиксируется ЭВМ. В некото­рых типах персональных компьютеров для этих же целей используется сенсорный экран. Окно здесь мо­жет быть указано световым пером, карандашом или просто пальцем. Следует отметить, что для объеди­нения разнородных элементов в системах, допускаю­щих использование оконного интерфейса, предусма­триваются специальные операции «разрезания и скле­ивания», обеспечивающие формирование единого документа. Весьма перспективной и удобной для пользователя является технология

What You See Is What You Get - что видите, то и полу­чаете, которая предполагает получение в твердой копии (на бумаге) того, что представлено в опреде­ленный момент на экране дисплея с максимальной степенью похожести. В прикладных программах, ос­нованных на технологии WYSIWYG, как правило, используются специальные «меню», предлагающие пользователю выбрать тот или иной набор команд используемого языка программирования. С помощью простых графических символов (знаков) на экране могут быть показаны различные предметы, исполь­зуемые в конкретном приложении. Например, для си­стемы организационного управления это могут быть картотеки, часы, папки для бумаг и т. п. Указывая на эти символы с помощью, например, мыши, поль­зователь задает те программные средства, которые реализуют функции этих предметов в вычислительной системе. Построенный на таких принципах интерфейс, в котором активно используются средства машинной графики, оказался существенно удобнее и понятнее для пользователей-непрограммистов, чем традицион­ные методы организации взаимодействия пользовате­ля и ЭВМ.

Особое значение имеют современные средства машинной графики в системах информационной поддержки автоматизированного проектирования, где визуализация информации является мощным средством повышения качества проектирования, сокраще­ния его сроков. Использование машинной графики в САПР до недавнего времени основывалось только на методах, в основу которых была положена аналогия с «воображаемым фотоаппаратом». Прикладные программы при таком подходе «порождают» двух- или трехмерный цветной «мир», состоящий из таких объектов, как описания рисунков, элементов и т. п., включая в фор­мируемые модели проектируемых объектов необходи­мые составляющие.

В получивших развитие в последние годы систе­мах, не использующих аналогии с фотоаппаратом, сначала выполняется моделирование проектируемого объекта, а затем визуализация, для чего применяют­ся «рисующие» программы, позволяющие перекраши­вать и перемешивать отдельные элементы моде­ли.

Если раньше в большинстве приложений машин­ной графики использовались двумерные изображения, то в последние годы особый интерес пользователей привлекают графические методы, позволяющие моде­лировать «трехмерные сцены», добиваться наиболее «реалистического» их изображения. Такие методы мо­гут использоваться не только в компьютерных играх и «компьютерной живописи», но и при решении за­дач автоматизации научных исследований и управ­ления, машинных методах обучения автоматизирована нога проектирования.

Манипулирование крупноформатными бланками. Большинство видов производственной, технологиче­ской, конструкторской, управленческой документации предполагает составление таблиц, в которых элемен­ты одной строки или столбца определяются на осно­вании значений других строк или столбцов. Напри­мер, в наряде на выполнение работ содержатся рас­ценки и трудоемкость, стоимость работ определяется как произведение этих показателей. Составление та­ких таблиц можно формально рассматривать как реализацию операций манипулирования бланками. В этом случае в ЭВМ могут быть сформированы аналоги таких бланков, и с помощью специального программного обес­печения процедур манипулирования крупноформатны­ми бланками пользователь может заполнять таблицы, а также выбирать рациональные решения и анализи­ровать возможные варианты.

Основная идея технологии манипулирования блан­ками (МБ) состоит в следующем. Про­граммы МБ рассматривают таблицу как совокуп­ность сегментов информации, координаты которых определяются пересечением строк и столбцов. Каж­дому сегменту присваивается идентификатор, который позволяет найти содержащуюся в сегменте информа­цию. Содержание сегмента может быть строкой тек­ста, числом, формулой. Для формирования докумен­тов используются также пустые сегменты, не содер­жащие какой-либо информации. При формировании бланка заполняются текстовые и формульные ячейки и задается формат выводимой таблицы. Сформиро­ванный документ отображается на экране дисплея и может быть отредактирован как по содержанию, так и по формату. Полностью сформированный и отре­дактированный документ выводится на печать. Тех­нология МБ предусматривает организацию оконного интерфейса и использование мышей. Для удобства пользователя имеются специальные «подсказки», по­зволяющие получить в режиме меню информацию о возможных форматах, командах МБ и т. п.

К числу основных направлений развития пакетов манипулирования бланками относят: совершенствова­ние методов организации оконного интерфейса; вклю­чение других средств (обработка текста, базы дан­ных); автоматизацию поиска рациональных вариан­тов решения задач, для описания которых формиру­ются крупноформатные бланки; стандартизацию фор­матов данных и протоколов обмена информацией.

Обработка текста. Средства обработки текста (ОТ) обеспечивают автоматизацию процесса оформ­ления документов со словесным содержанием. Основной идеей, реализованной в ОТ, является расщепле­ние процесса оформления текста на два этапа: на­бор и запоминание содержания в памяти ЭВМ; вы дача текста на печатающее устройство. Отметим, что развитие такого подхода к автоматизации ОТ при вело к широкому использованию текстовых процессо­ров.

В заключение отметим, что манипулирование бланками и обработка текстов, а также машинная графика становятся по-настоящему эффективными лишь при использовании баз данных. Это особенно отчетливо видно на примере систем автоматизации проектирования. Отсутствие средств хранения и на­копления информации делает МБ, ОТ и машинную графику лишь красивыми игрушками для демонстрации нереализованных возможностей вычислитель­ной техники.

Распределенные информационные системы

Под распределенной информационной системой (РИС) в настоящее время понимается комплекс тер­риториально-удаленных или организационно незави­симых информационных систем, которые, выполняя закрепленные за ними функции обработки данных, обеспечивают коллективное использование информа­ционных ресурсов пользователями каждой ИС. РИС представляют собой результат дальнейшего развития систем распределенной обработки данных (СРОД), основной целью которых, как известно, является пре­доставление возможности большому числу территори­ально разобщенных пользователей одновременно об­ращаться к вычислительным ресурсам системы. Наиболее типичными примерами СРОД могут слу­жить вычислительные центры коллективного пользо­вания (ВЦКП). На современных ВЦКП реализован удаленный режим телеобработки данных, который предусматривает наличие в ВЦКП мощной вычисли­тельной системы, а у пользователей - удаленных тер­миналов этой ЭВМ (дисплеев и печатающих уст­ройств). Вся работа пользователя осуществляется со своей «территории». Так же как и при наличии соб­ственной вычислительной системы, пользователи ВЦКП могут создавать информационные системы в своих приложениях. Однако такие ИС не являются распределенными: они и их пользователи лишь фи­зически разобщены территориально (что для поль­зователя особого значения не имеет). Работа с та­кими информационными системами ничем не отли­чается от обычного режима работы ИС. Примерами таких систем является большинство автоматизирован­ных систем научно-технической информации.

Развитие информационно-вычислительных сетей привело к появлению собственно распределенных ин­формационных систем, отличительной особенностью которых являются распределенные базы данных (РБД).

Под РБД в настоящее время понимается такая система организации, хранения, накопления, обработ­ки и представления данных, при которой предусмо­трено определенное закрепление фиксированных ин­формационных структур за конкретными базами дан­ных (конкретными информационными системами), на­зываемыми локальными. Эти структуры в общем слу­чае доступны пользователю любой локальной инфор­мационной системы, любой локальной базы данных.

Распределенные информационные системы нахо­дят все большее практическое применение. Наиболее ярким примером распределенной информационной системы, охватыва­ющей разные приложения (исследование, проектиро­вание, подготовку производства, производство, управление) является система информационного обеспечения интегрированного производственного комплекса.

В соответствии с работами стра­тегии распределения данных на информационно-вы­числительной сети могут быть классифицированы в зависимости от числа узлов, т. е. архитектуры распределенной информационной системы, и наличия дублирования информации. Различают четыре основ­ных типа стратегий которые, в свою очередь, определяют тип РИС.

Централизация. Единственная копия базы данных расположена в одном узле. Основным преимуществом данной стратегии является простота ее реализации. В этом случае вся информация концентрируется в одном (центральном) узле, объем вторичной памяти в котором ограничивает возможный размер базы дан­ных. Все запросы на выборку и обновление данных должны направляться в центральный узел, что при­водит к существенным затратам на реализацию каж­дого запроса, задержке его выполнения, снижению надежности работы с централизованной базой дан­ных.

Расчленение. Единственная копия базы данных, локальные базы распределены по различным узлам. При использовании стратегии расчленения объем распределенной базы данных ограничивается уже необ­ходимым объемом вторичной памяти, имеющейся во всей информационно-вычислительной сети данной РИС. Время отклика на запрос определяется «гло­бальностью» этого запроса и может быть существен­но меньше, чем при использовании стратегии центра­лизации для реализации запроса на уровне локальной базы данных, находящейся в узле РИС, и сравнимо с временем отклика при централизации в тех случа­ях, когда для реализации данного запроса необходи­ма организация доступа к ряду ЛБД. Необходимо отметить, что эффективность стратегии расчленения тем выше, чем выше степень локализации ссылок, т. е. чем большее число запросов пользователей ре­ализуется в базах данных, соответствующих локальных информационных систем (ЛИС).

Дублирование. Имеется несколько копий базы данных; в каждом узле располагается полная копия всех данных. Основные преимущества данной стратегии- высокая надежность и простота восстановле­ния. Эта стратегия наиболее эффективна в тех слу­чаях, когда обеспечение надежности является опреде­ляющим фактором, объем базы данных небольшой, а интенсивность обновления невысокая (например, базы данных с интенсивными запросами справочного характера).

Смешанная стратегия. Возможны два основных типа. При смешанной стратегии типа А создается не­сколько копий локальных баз данных, в каждом узле находится некоторый фрагмент распределенной базы данных. При этой стратегии объединяются подходы, предполагающие расчленение и дублирование дан­ных. Основное преимущество - гибкость. Недостатки определяются сложностью реализации, т. е. для этой стратегии характерны недостатки, присущие как расчленению, так и дублированию. Смешанная стратегия типа В представляет собой объединение стратегий расчленения и централизации. Каждая локальная информационная система имеет свою ЛБД, но некото­рые фрагменты этих ЛБД (особо важные, архивные и т. п.) организуются в базе данных центральной ЭВМ РИС. Основными достоинствами являются гиб­кость и надежность, недостатки-то же, что и при централизации данных.

Отметим, что в практических приложениях целесо­образно, как правило, использование смешанных стратегий. При этом выбор типа смешанной страте­гии во многом определяется архитектурой той инфор­мационно-вычислительной сети, на которой реализу­ется конкретная распределенная информационная система.

Возможность объединения локальных баз данных, а следовательно, и создания эффективного внутриси­стемного обеспечения систем автоматизации и информационных систем достигается при разработке интегрированной базы данных (ИБД), важнейшим элементом которой является система управления распределенными базами данных (СУРБД). СУРБД обычно имеет многоуровневую архитектуру, в которой выделяются пять уровней, подразделяемых на две основные части.

Верхние четыре уровня процессоров - пользова­тельский, глобальный, логический, фрагментарный и распределенный могут быть сгруппированы и рассматриваться как сетевая СУБД, т. е. система, обеспе­чивающая работу с распределенными на ИВС данными. На пятом уровне находится процессор узлового представления, в качестве которого выступаем СУБД локальной базы данных или локальная СУБД. Каждый из уровней поддерживает различные пред­ставления интегрированной базы данных. Любой уро­вень взаимодействует только со смежными уровнями представления. На самом верхнем уровне СУРБД на­ходятся интерфейсы пользователей систем автомати­зации, входящих в ИПК, или локальных информационных систем РИС, которые могут рассматриваться как процессоры запросов.

Уровень глобального логического представления со­ответствует логической структуре всей интегрировав- ной базы данных ИНК в представлении руководите­лей служб, деятельность которых автоматизируется локальными ПС или подсистемами интегрированного производственного комплекса. Часть, являющаяся подмножеством глобального логического представле­ния и доступная конечным пользователям интегрированной базы данных, называется, пользователь­ским уровнем представления. Каждый пользователь может иметь отличное от других пользовательское представление, соответ­ствующее его информа­ционным потребностям и требованиям защиты ин­формации.

Введение третьего и четвертого уровней пред­ставления является след­ствием распределенности интегрированной базы данных и наличия в ней некоторой управляемой избыточности данных. Уровень фрагментарного представления позволяет описать несвязанные под­множества интегрирован­ной базы данных, назы­ваемые логическими фрагментами. Территориальное расположение на информационно-вычислительной сети РИС каждого ло­гического фрагмента определяется на четвертом уровне- уровне распределенного представления. При этом разрешается существование нескольких идентич­ных, но территориально разнесенных копий одного фрагмента, называемых хранимыми фрагментами. Размещение хранимых фрагментов, представляющих собой физическую реализацию ЛБД, определяется принятыми при построении распределенной информа­ционной системы ограничениями по памяти входящих в ИВС ЭВМ и требуемым временем реализации за­проса.

Как правило, базы данных локальных информа­ционных систем, составляющих РИС, проектируются при использовании некоторой общей СУБД. Образуе­мая при этом система локальных баз данных полу­чила название системы однородных ЛБД.

Если для построения локальных систем использу­ются разнотипные системы управления базами дан­ных, то получаемая в результате система ЛБД явля­ется неоднородной. Для неоднородных систем инте­грация локальных БД существенно усложняется. В этом случае на передний план выступает задача конвертирования баз данных, т. е. реорганизация БД, спроектированной в схеме одной СУБД, в базу данных того же содержания, но в схеме другой системы управления базами данных.

Сложные информационные структуры и работающие с ними системы

Развитие методов новой информационной технологии обеспечивает возможность развития информационных систем в ИС нового типа, позволяющих хранить, накапливать, обрабатывать и представлять пользователям более сложные информационные структуры, чем данные, -такие как правила получения результатов, фактов, не полностью формализованных алгоритмов решения задач и т. п. Эти сложные информационные структуры получили название «машинное знание». Следует отметить, что хотя сейчас уже достаточно интенсивно используются такие понятия, как «база знаний», «представление знаний», сам термин «знание» в области информатики, вычислительной техники, автоматизации произ­водства еще до конца не определен. Понятие «машинное знание» возникло в области искусственного интеллекта еще в середине 60-х годов, когда были построены первые диалоговые системы и решатели задач. Тогда для этой цели впер­вые были использованы семантические сети. Однако, несмотря на весьма интенсивное развитие этого на­правления и создание ряда формализмов для пред­ставления знаний (фреймы, ассоциативные сети, продукционные отношения и т. п.), однозначно сформулировать понятие «машинное знание» до сих пор не удается.

В настоящее время под знанием в информатике понимаются: информация, представленная в виде текста на профессионально-ограниченном естествен­ном языке; данные, управляющие решением приклад­ных программ; готовые программные средства (ма­шинные алгоритмы, большей частью эвристические), сформированные для определенного класса задач и автоматически вызываемые системой при решении конкретной прикладной задачи; описания объектов и ситуаций; информация, формируемая в процессе ре­шения конкретных задач и используемая в дальней­шем для решения других задач данного класса (но­вые знания).

Системы, строящиеся по принципу баз данных, но хранящие и представляющие пользователю по его за­просу те или иные знания по предметной области, получили название баз знаний (БЗ). Очевидно, что БЗ и базы данных являются информационными системами «родственных» классов, причем базу знаний можно рассматривать как некоторое развитие БД, включающую в свой состав базу данных как статическую часть. Основной проблемой создания БЗ является представление знаний.

Как уже отмечалось, одним из первых формализмов, используемых для представления знаний различ­ных предметных областей, являются семантические сети (С -сети). Графической моделью сложной информационной структуры при использовании С -сетей выступает граф, множество вершин которого моделирует рассматриваемые информационные объекты, а множество дуг - семантические отношения между этими объектами. Первые семантические сетевые модели не предполагали строгого различия между разнородны­ми вершинами. Они допускали представление в одной С -сети как экземпляров конкретных объектов, так и классов (типов) объектов. Здесь представляет­ся уместным более подробно рассмотреть два поня­тия, которые относятся к числу основных при по­строении различных формализмов представления знаний.

Любое, используемое в практической деятельности понятие может быть охарактеризовано экстенсионалом и интенсионалом. Трактуя эти характеристики прагматически, усло­вимся понимать под экстенсионалом набор конкретных данных, определяющих некоторое понятие и представленных в декларативной форме. Например, экстенсионалом дворняжка, такса, овчарка будет понятие собаки, экстенсионалом понятий соба­ка, кошка - понятие домашние животные. Интенсионал же, как правило, определяет некоторую процедуру, позволяющую оценить принадлежность конкретного факта к некоторому понятию. Например, интенсионал для включения экстенсионалов (дворняжка, так­са, овчарка) в экстенсионал собаки может быть задан в следующем виде: бегает на четырех лапах, имеет хвост, лает, кусается).

Другими словами, интенсионал выделяет знания, отделяет их от данных, которые всегда задаются экстенсионально. С понятиями экстенсионал может быть соотнесена декларативная (статическая) часть базы знаний, с понятием интенсионал - процедурная часть БЗ.

Таким образом, на начальном этапе развития се­мантических сетей в них не предусматривали введе­ния различий между экстенсиональными и интенсио­нальными вершинами. Для соединения разнотипных вершин использовались идентичные типы дуг. Позд­нее С -сети были развиты в сторону сближения с мо­делями данных, разработанными в теории систем управления базами данных. Так, во многих С -сетях установлены формальные различия между разнотипными вершинами и дугами. В современных С -сетях особую роль играет определение семантиче­ской близости, расстояния, измеренного на семантической сети. Для этого имеется возможность в явной форме отразить отрицание взаимосвязи между вер­шинами.

Основным элементом семантической дуги является высказывание, которое отображается подграфом и является той минимальной информационной структурой которая вводится и хранится в С -сети. Каждая вершина С -сети отображает один объект, что позволяет задать для нее несколько входящих и выходящих дуг, связанных с .различными высказываниями.

Базовым понятием С -сети является понятие “сущность”. Все сущности рассматриваются в качестве элементов некоторого универсального множества. Введение понятия сущность связано с представлением о регулярности мира, в соответст­вии с которым реальный мир рассматривается состоящим из стереотипных (часто повторяющихся) ситуа­ций. Под ситуацией может пониматься некото­рый предмет, свойства предмета в определенный мо­мент времени, действие, зрительный образ, повество­вание и т. д. Стереотипная ситуация есть множество конкретных ситуаций. Например, конкретная ситуа­ция - выпуск продукции ГПС механообработки тел вращения -соответствует стереотипным ситуациям: «гибкая производственная система», «выпуск продук­ции», «обработка тел вращения». Конкретные ситуа­ции могут быть элементарными, т. е. не иметь внут­ренней структуры и быть пределом работоспособно­сти в данной модели внешнего мира, и сложными, т. е. связанными с несколькими другими конкретны­ми ситуациями, дополняющими исходную. Такой подход к описанию внешнего мира позволяет трактовать процесс представления знаний как соглашение о том, как, используя стереотипные и конкретные ситуации, описывать внешний мир.

Для отображения семантических отношений в С -сетях используются четыре класса связей: лингви­стические, логические, теоретико-множественные и квантификационные. Лингвистические связи включают: глубинно-падежные отношения (падежи Филмора), соответствующие глаголам русского языка (агент совершаемого действия; тема или предмет, над которым совершается действие; источник или начальное состояние объекта; цель конечное со­стояние объекта; инструмент или вспомогательный объект, характеризующий способ совершения дей­ствия; способ или путь достижения цели); глаголь­ные характеризации (время, наклонение, вид, род, число, залог используемого глагола); атрибутивные отношения (модификация, цвет, вес, размер, форма, отношения принадлежности и т. п.). Логические свя­зи включают операции алгебры логики (конъюнкцию, дизъюнкцию, отрицание, импликацию). Теоретико-множественные связи -это отношение части и цело­го, элемент множества, подмножество и т. д., которые используются для построения иерархии подчинения. Наконец, квантификационные связи отобража­ются логическими кванторами (существования и общности), нелогическими кванторами (много, мало, несколько и т. п.), а также числовыми характеристи­ками объектов.

Соседние файлы в папке Kolokvium