Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие (Интеллектулльные информационные технологии) (ТГУ).doc
Скачиваний:
358
Добавлен:
19.03.2016
Размер:
3.8 Mб
Скачать

1.2. Данные и знания

Данные – это информация, полученная в результате наблюдений или измерений отдельных свойств (атрибутов), характеризующих объекты, процессы и явления предметной области. При обработке на компьютере данные трансформируются, условно проходя следующие этапы:

  • данные как результат измерений и наблюдений;

  • данные на материальных носителях информации (таблицы, протоколы);

  • структуры данных в виде диаграмм, графиков, функций;

  • данные на языке описания (сетевые, иерархические, реляционные модели представления данных);

  • базы данных (БД) на машинных носителях информации.

Знания – это связи и закономерности предметной области (принципы, модели, законы), полученные в результате практической деятельности и профессионального опыта, позволяющего специалистам ставить и решать задачи в данной области. При обработке на компьютере знания трансформируются аналогично данным:

  • знания в памяти человека как результат анализа опыта и мышления;

  • материальные носители знаний (литература, учебники, аналитические отчеты);

  • поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, связывающих их;

  • знания, описанные на языках представления знаний (формально-логические, продукционные, фреймовые модели, семантические сети);

  • база знаний (БЗ) на машинных носителях информации.

Существенными для понимания природы знаний являются способы определения понятий. Один из широко применяемых способов основан на идее интенсионала и экстенсионала. Интенсионал понятия – это определение его через соотнесение с понятием более высокого уровня абстракции с указанием специфических свойств. Экстенсионал – это определение понятия через перечисление его конкретных примеров. При этом интенсионалы формируют знания об объектах, а экстенсионалы объединяют данные. Вместе они формируют элементы поля знаний конкретной предметной области.

    1. Эволюция развития информационных систем

Принятие решений относительно действий или поведения в той или иной ситуации любых субъектов осуществляется на основе информационных процессов (ИП). ИП реализует отношения объекта и субъекта и представляет собой восприятие субъектом объективной реальности в виде данных, переработку этих данных в соответствии с целевой установкой и имеющимися знаниями о зависимостях фактов в информацию. На основе полученной информации происходят обновление знания субъекта, выработка решения по возможному изменению состояния объекта и целевой установки субъекта. Следовательно, ИП может быть рассмотрен в трех аспектах:

  • синтаксический аспект – предполагает отображение объективной реальности в некоторой среде или на определенном языке;

  • семантический аспект – определяет понимание и интерпретацию данных на основе знаний субъекта, которые отражают зависимости, закономерности взаимодействия объектов;

  • прагматический аспект – предусматривает оценку полезности полученного нового знания субъекта в соответствии с целевой установкой для принятия решения.

В широком смысле под информацией понимаются все три аспекта отражения ИП. Любая ИС обеспечивает ввод данных, хранение, обработку информации и вывод результатов.

Знание имеет двоякую природу: предметную (фактуальную) и проблемную (операционную). Предметное знание представляет известные сведения об объектах отражаемой реальности, они накапливаются в базе данных. Проблемное знание отражает зависимости и отношения между объектами, которые позволяют интерпретировать данные или извлекать из них информацию. Проблемные знания представляются либо в алгоритмической форме, либо в декларативной форме в виде БЗ. Часто предметные знания называют экстенсиональными (детализированными), а проблемные – интенсиональными (обобщенными).

ИП с помощью компьютерной информационной системы сводится к адекватному соединению предметных и проблемных знаний, что в различных ИС осуществляется по-разному. В системах, основанных на БД, происходит отделение предметных и проблемных знаний. Первые организуются в виде БД, вторые – в виде алгоритмов и соответствующих программ. В качестве посредника при этом выступает некоторая СУБД. Концепция независимости программ от данных позволяет повысить гибкость ИС по выполнению информационных запросов, но пользователь должен знать структуру БД и алгоритм решения задачи. Недостатками традиционных ИС является слабая адаптивность к изменениям в предметной области и невозможность решения плохо формализованных задач.

Эти недостатки устраняются в ИИС. При этом проблемные знания выделяются в БЗ, которая в декларативной форме хранит общие для различных задач единицы знаний. Управляющая структура приобретает характер универсального механизма решения задач (механизма вывода).

Следующим шагом в развитии ИИС является выделение в самостоятельную подсистему (репозитарий) метазнаний (знания о знаниях), которые описывают структуру предметных и проблемных знаний. Репозитарий отражает модель проблемной области в виде совокупности данных и правил. ИИС, обрабатывающие метазнания, получили название систем, основанных на моделях. В таких системах и программы, и структуры данных генерируются или компонуются из единиц знаний, описанных в репозитарии, каждый раз при изменении модели проблемной области [3].

Для ИИС, ориентированных на генерацию алгоритмов решения задач, характерны следующие признаки:

  • развитые коммуникативные способности;

  • умение решать сложные плохо формализуемые задачи;

  • способность к самообучению;

  • адаптивность.

Коммуникативные способности ИИС характеризуют способ взаимодействия конечного пользователя с системой, в частности, возможность формулирования произвольного запроса в диалоге с ИИС на языке, максимально приближенном к естественному. Сложные плохо формализованные задачи – это задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний. Способность к самообучению – это возможность автоматического извлечения знаний для решения задач из накопленного опыта конкретных ситуаций. Адаптивность – способность к развитию системы в соответствии с объективными изменениями модели проблемной области.

Знания могут быть классифицированы по категориям [2]:

  • поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

  • глубинные – абстракции, аналогии, схемы, отображающие структуры и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.

Современные ЭС работают с поверхностными знаниями. Исторически первичными были процедурные знания, то есть знания, «растворенные» в алгоритмах. Эти знания управляют данными. Для их изменения необходимо переделать программу. С развитием ИИ приоритет данных постепенно изменялся и все большая их часть сосредоточивалась в структурах данных (таблицы, списки, графы), то есть увеличивалась роль декларативных знаний.