- •Введение
- •1. Основные направления исследований в области искусственного интеллекта
- •Контрольные вопросы и задания
- •2. Классификация интеллектуальных информационных систем
- •2.1. Системы с интеллектуальным интерфейсом
- •2.2. Экспертные системы
- •2.3. Самообучающиеся системы
- •2.4. Адаптивные информационные системы
- •Контрольные вопросы
- •3. Представление данных и знаний
- •3.1. Данные
- •3.2. Знания
- •Контрольные вопросы
- •4. Классические способы представления знаний в интеллектуальных системах
- •4.1. Логическая модель представления знаний
- •4.2. Представление знаний правилами продукций
- •4.3. Объектно-ориентированное представление знаний фреймами
- •4.4. Семантические сети
- •Контрольные вопросы
- •5. Способы обработки знаний
- •5.1. Методы поиска решений на основе исчисления предикатов
- •5.2. Прямой и обратный вывод в экспертных системах продукционного типа
- •5.3. Обработка знаний в интеллектуальных системах с фреймовым представлением
- •Контрольные вопросы
- •6. Методы приобретения знаний
- •6.1. Проблемы структурирования знаний
- •Контрольные вопросы
- •7. Методы принятия решений на основе нечетких знаний
- •7. 1. Элементы теории нечетких множеств
- •7.2. Нечеткие операции, отношения и свойства отношений
- •7.3. Многокритериальный выбор альтернатив с использованием правила нечеткого вывода
- •7.4. Ранжирование альтернатив на множестве лингвистических векторных оценок
- •7.5. Метод нечеткого логического вывода в задаче выбора фирмой кандидата на замещение вакантной должности бухгалтера
- •Контрольные вопросы и задания
- •8. Технологии разработки экспертных систем
- •8.1. Технология проектирования и разработки экспертных систем
- •8.2. Этапы проектирования баз знаний
- •8.3. Методы проектирования баз знаний
- •8.4. Характеристика инструментальных средств
- •Контрольные вопросы и задания
- •9. Технологические процессы объектно-ориентированного программирования в проектировании интеллектуальной системы поддержки управления
- •Заключение
- •Библиографический список
- •Оглавление
3.2. Знания
Рассмотрим общую совокупность качественных свойств для знаний (специфических признаков знаний) и перечислим ряд особенностей, присущих этой форме представления информации в ЭВМ и позволяющих охарактеризовать сам термин «знания» [4].
Прежде всего знания имеют более сложную структуру, чем данные (метаданные). При этом знания задаются как экстенсионально (т.е. через набор конкретных фактов, соответствующих данному понятию и касающихся предметной области), так и интенсионально (т.е. через свойства, соответствующие данному понятию, и схе му связей между атрибутами). С учетом сказанного перечислим свойства.
Внутренняя интерпретируемость знаний. Каждая информационная единица (ИЕ) должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомянуто. Когда данные, хранящиеся в памяти, были лишены имен, то отсутствовала возможность их идентификации системой. Данные могла идентифицировать лишь программа.
Если, например, в память ЭВМ нужно было записать сведения о студентах вуза, представленные в табл. 3.9, то без внутренней интерпретации в память ЭВМ была бы записана совокупность из четырех машинных слов, соответствующих строкам этой таблицы.
Таблица 3.9
Сведения о студентах
Фамилия |
Год рождения |
Факультет |
Курс |
Петров |
1978 |
Экономический |
2-й |
Захаров |
1977 |
Механический |
3-й |
Иванов |
1976 |
Транспортный |
4-й |
Кузьмин |
1975 |
Электротехнический |
5-й |
При этом информация о том, какими группами двоичных разрядов в этих машинных словах закодированы сведения о студентах, у системы отсутствует. Они известны лишь программисту.
При переходе к знаниям в память ЭВМ вводится информация о некоторой протоструктуре информационных единиц. В рассматриваемом примере она представляет собой специальное машинное слово, в котором указано, в каких разрядах хранятся сведения о фамилиях, годах рождения, специальностях и курсе. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы фамилии, года рождения, название специальностей и курса. Все эти атрибуты могут играть роль имен для тех машинных слов, которые соответствуют строчкам таблицы. По ним можно осуществлять поиск нужной информации. Каждая строка таблицы будет экземпляром протоструктуры. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируемости всех ИЕ, хранимых в базе данных.
Структурированность (рекурсивная структурированность) знаний. Информационные единицы должны обладать гибкой структурой. Для них должен выполняться «принцип матрешки», т.е. рекурсивная вложимость одних ИЕ в другие. Каждая ИЕ может быть включена в состав любой другой, и из каждой ИЕ можно выделить некоторые составляющие ее ИЕ. Другими словами, должна существовать возможность произвольного установления между отдельными ИЕ отношений типа «часть — целое», «род — вид» или «элемент — класс».
Связность (взаимосвязь единиц знаний). В информационной базе между ИЕ должна быть предусмотрена возможность установления связей различного типа. Прежде всего эти связи могут характеризовать отношения между ИЕ. Семантика отношений может носить декларативный или процедурный характер. Например, две или более ИЕ могут быть связаны отношением «одновременно», две ИЕ — отношением «причина — следствие» или отношением «аргумент —- функция». Приведенные отношения характеризуют декларативные знания. Различают отношения структуризации, функциональные отношения, каузальные отношения и семантические отношения. С помощью первых задаются иерархии ИЕ, вторые несут процедурную информацию, позволяющую находить (вычислять) одни ИЕ через другие, третьи задают причинно-следственные связи, четвертые соответствуют всем остальным отношениям.
Между ИЕ могут устанавливаться и иные связи, например определяющие порядок выбора ИЕ из памяти или указывающие на то, что две ИЕ несовместимы друг с другом в одном описании.
Перечисленные три особенности знаний позволяют ввести общую модель представления знаний, которую можно назвать семантической сетью, представляющей собой иерархическую сеть, в вершинах которой находятся ИЕ. Эти единицы снабжены индивидуальными именами. Дуги семантической сети соответствуют различным связям между ИЕ. При этом иерархические связи определяются отношениями структуризации, а семантические связи — отношениями иных типов.
Семантическая метрика (семантическое пространство знаний с метрикой). На множестве ИЕ в некоторых случаях полезно задавать отношение, характеризующее ситуационную близость ИЕ, т.е. ассоциативную связь между ИЕ. Его можно было бы назвать отношением релевантности для ИЕ. Такое отношение дает возможность выделять в информационной базе некоторые типовые ситуации (например, «покупка», «регулирование движения на перекрестке»). Отношение релевантности при работе с ИЕ позволяет находить знания, близкие к уже найденным.
Активность знаний. С момента появления ЭВМ и разделения используемых в ней ИЕ на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, протекающие в ЭВМ, инициируются командами, а данные используются этими командами лишь в случае необходимости. Для ИнС эта ситуация неприемлема. Как и у человека, в ИнС актуализации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в ИнС должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы.
Рис. 3.6. Классификация знаний по «глубине»
Следует упомянуть о функциональной целостности знаний, т.е. возможности выбора желаемого результата, времени и средств получения результата, средств анализа достаточности полученного результата.
Перечисленные пять особенностей ИЕ определяют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний (БЗ). Совокупность средств, обеспечивающих работу со знаниями, образует систему управления базой знаний (СУБЗ). Однако к БЗ, в которых в полной мере была бы реализована внутренняя интерпретируемость, структуризация, связность, введена семантическая мера и обеспечена активность знаний, еще необходимо проделать определенный путь.
Все приведенные выше качественные свойства знаний касаются в основном уровня Зн1 и связаны со сложной природой знания, изучение которой происходит на междисциплинарном стыке таких наук, как кибернетика, лингвистика, психология и т.д.
Из всего многообразия существующих способов классификации знаний на рис. 3.7—3.9 представлены наиболее важные из них с точки зрения технологии разработки ИнС [1, 2, 4].
Рис. 3.7. Классификация знаний по
«жесткости»
Рис. 3.8. Номенклатура (состав) знаний, используемых различными компонентами ИнС
Рис. 3.9. Классификация знаний на основе учета их использования в процессе работы в ИнС
«Знания — это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области» [5].
«Знания — это хорошо структурированные данные или данные о данных, или метаданные» [5].
«Знания — формализованная информация, на которую ссылаются или используют в процессе логического вывода» [3].
В области систем ИИ и инженерии знаний определение знаний увязывается с логическим выводом: знания - это информация, на основании которой реализуется процесс логического вывода, т.е. на основании этой информации можно делать различные заключения по имеющимся в системе данным с помощью логического вывода. Механизм логического вывода позволяет связывать воедино отдельные фрагменты, а затем на этой последовательности связанных фрагментов делать заключение.
Знания — это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода (рис. 3.10.).
Р ис. 3.10. Процесс логического вывода в ИС
Под знанием будем понимать совокупность фактов и правил. Понятие правила, представляющего фрагмент знаний, имеет вид:
если <условие> то <действие>.
Это определение есть частный случай предыдущего определения.
Однако признается, что отличительные качественные особенности знаний обусловлены наличием у них больших возможностей в направлении структурирования и взаимосвязанности составных единиц, их интерпретируемости, наличие метрики, функциональной целостности, активности.
Форма представления знаний оказывает существенное влияние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать невозможно. Поэтому в интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, в связи с чем неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний. Следует заметить, что одновременно выполнить эти требования довольно сложно, особенно в больших системах, где неизбежным становится структурирование и модульное представление знаний.
Решение задач инженерии знаний выдвигает проблему преобразования информации, полученной от экспертов в виде фактов и правил их использования, в форму, которая может быть эффективно реализована при машинной обработке этой информации. С этой целью созданы и используются в действующих системах различные модели представления знаний.
К классическим моделям представления знаний относятся логическая, продукционная, фреймовая и модель семантической сети.
Каждой модели отвечает свой язык представления знаний. Однако на практике редко удается обойтись рамками одной модели при разработке ИИС за исключением самых простых случаев, поэтому представление знаний получается сложным. Кроме комбинированного представления с помощью различных моделей, обычно используются специальные средства, позволяющие отразить особенности конкретных знаний о предметной области, а также различные способы устранения и учета нечеткости и неполноты знаний.