- •Введение
- •Глава 1. Ведение в системы искусственного интеллекта
- •1.1. Архитектура систем искусственного интеллекта
- •1.2. База знаний и данных
- •1.1.1 Понятие модели
- •1.1.2. Логические модели
- •1.1.3 Модели знаний на основе продукций
- •1.1.4 Фреймовая модель знаний
- •1.1.5 Семантические сети
- •1.3. Машина вывода
- •1.3.1. Понятие формальной системы
- •Примеры стратегии вывода
- •Как функционирует машина вывода
- •1.4. Извлечение знаний и обучение
- •1.4.1. Извлечение знаний от многих экспертов
- •1.4.2 Проблема непротиворечивости формализованной базы знаний
- •1.5. Обучение системы
- •1.6. Интерфейс с пользователем
- •1.7. Организация работы
- •1.8. Инструментальные средства создания систем искусственного интеллекта
- •Языки программирования
- •1.8.2. Языки продукционного программирования
- •1. 8. 3. Языки инженерии знаний и инструментальные системы
- •1.8.3.1. Система vpExpert
- •1.8.3.2. Система kas
- •1.8.3.3. Система Expert-Ease
- •Глава 2. База знаний
- •2.1. Методы извлечения знаний
- •2.1.1. Классификация методов извлечения знаний
- •2.1.2. Пассивные методы
- •2.1.2.1. Наблюдения
- •2.1.2.2. Анализ протоколов «мыслей вслух»
- •2.1.2.3. Лекции
- •2.1.3. Активные индивидуальные методы
- •2.1.3.1. Анкетирование
- •2.1.3.2. Интервью
- •2.1.3.3. Свободный диалог
- •2.1.4. Активные групповые методы
- •2.1.4.1. «Круглый стол»
- •2.1.4.2. «Мозговой штурм»
- •2.1.4.3. Экспертные игры
- •2.1.4.3.1. Игры с экспертом
- •2.1.4.3.2. Ролевые игры в группе
- •2.1.4.4. Игры с тренажерами
- •2.1.4.4.1. Компьютерные экспертные игры
- •2.1.5. Текстологические методы
- •2.2.Формальное описание понятий предметной области (по)
- •2.2.1. Методы абстрагирования понятий
- •2.2.1.1.Агрегация и декомпозиция понятий
- •2.2.1.2.Обобщение и специализация понятий
- •2.2.1.3.Типизация и конкретизация понятий
- •2.2.1.4.Ассоциация и индивидуализация понятий
- •2.3.Методы классификации
- •2.3.1. Экстенсиональный и интенсиональный аспекты классификации
- •2.3.2. Таксономия и мерономия
- •2.3.3. Типы классификаций
- •2.3.4. Древовидные классификации
- •2.3.5. Булевы классификации
- •2.3.6. Комбинативные классификации
- •2.4.События и процессы
- •2.4.1. Состояния предметной области
- •2.4.2. Событие
- •2.4.3. Последовательные процессы
- •2.4.4. Рекурсивные процессы
- •2.4.5. Ветвящиеся процессы
- •2.5. Системы продукций: структура, технология, применение
- •2.5.1. Неформальное введение в системы продукций
- •2.5.1.1 Алгоритмические модели
- •2.5.2 Логический вывод
- •2.5.3 Прикладные модели
- •2.5.4. Метамодель систем продукций
- •2.5.4.1. Основные подсистемы
- •2.5.5.2. Метаструктура базы данных и операций
- •2.5.5.2.1. Характер организации данных
- •2.5.5.2.2 Операции над базой данных
- •2.5.5.2.3 Контроль несовместимости
- •2.5.5.2.4 Ассоциативная надстройка
- •2.5.6. Метаструктура модуля правил
- •2.5.6.1 Аппарат активации
- •2.5.6.2 Структура правил
- •2.5.7. Метаструктура модуля управления
- •2.5.8. Технология поддержки разработок продукционных систем
- •2.5.9. Формальные модели систем продукций
- •2.5.9.1. Алгебраическая модель
- •2.5.9.1.1. Основные определения
- •2.5.9.1.2. Операции преобразования ситуации
- •2.5.9.1.3. Условия корректности вычислений над конъюнктивной базой данных
- •2.5.9.1.4. Однозначность вычислений над дизъюнктивной базой
- •2.5.9.2. Управление выводом в системах продукций
- •2.5.9.3. Язык управления применением продукций
- •2.5.9.4. Язык управления выбором данных
- •2.5.9.5. Обзор формальных моделей вычислений
- •2.5.10. Экспериментальные системы продукций
- •2.5.10.1. Система скип
- •2.5.10.2. Система анализа топологических чертежей интегральных схем
- •P(слой) x0, y0 : Dx1, Dy2, .., Dxn-1, Dyn;
- •2.6. Выводы к второй главе
- •3. Машина логического вывода
- •3.1. Формальное определение задачи
- •3.2. Специфика решения задач в сии
- •3.3. Управление процессом решения задачи
- •3.4. Модели эвристического поиска решений
- •3.4.1 Стратегия поиска в глубину
- •3.4.2. Стратегии перебора с отсечениями
- •3.4.2.1. Метод ветвей и границ
- •3.4.2.2. Стратегии поиска на основе эвристической функции оценки
- •3.5. Методы вывода и доказательства теорем
- •3.5.1 Механизм резолюции Робинсона
- •3.5.2. Резолюция в логике высказываний
- •3.5.2.1 Линейная резолюция вL
- •Метод линейного вывода в lЛавленда, Ковальского и Кюнера
- •Эффективная реализация
- •3.5.2.3. Метод поиска в глубину
- •3.5.2.4 Эвристики поиска в дереве
- •3.5.2.5. Семантическая резолюция
- •3.5.3 Резолюция в pl
- •3.6. Методы индуктивного вывода
- •3.6.1. Виды индукции
- •3.6.2. Индукция как вывод и индукция как метод
- •3.6.3. Правила, необходимые для систем автоматического формирования знаний
- •3.7. Дедуктивный вывод на семантических сетях
- •3.7.1. Нерезолютивные методы вывода на семантических сетях
1.4. Извлечение знаний и обучение
Модуль извлечения знаний в составе экспертной системы не является обязательным компонентом. СИИ должна обеспечивать функцию ввода и обновление знаний. Эта функция либо реализуется в направлении "эксперт система", либо СИИ извлекает новые знания из тех, которые уже содержатся в базе знаний. Последняя возможность осуществляется на основе механизмов вывода знаний и обучения. Существующие сложности, связанные с формированием понятий машиной, а также отсутствием эффективных формализмов для оперирования абстрактными значениями. Это обстоятельство не позволяет пока вести речь о коммерчески реализованных модулях обучения (самообучения) в составе экспертных систем. Вместе с тем, поскольку проблема обозначена, практически важные результаты научных исследований следует скорее всего ожидать в областях, где СИИ работает с задачами классификации и распознавания. Остановимся на этих вопросах подробнее.
1.4.1. Извлечение знаний от многих экспертов
Извлечение знаний от экспертов ставит следующие проблемы:
в какой форме осуществляется диалог с экспертами?
как обрабатывать информацию, представленную экспертами?
Первая проблема состоит в том, что СИИ "не имеет представлений" о том, что она призвана решать. Иначе говоря, она либо ведет один и тот же сценарий диалога, либо вообще является пассивной стороной, представляя эксперту набор директив редактора базы знаний. Однако, даже и в этом последнем случае встает проблема, чтобы введенная экспертом информация:
(а1) была непротиворечивой;
(а2) не нарушала целостность существующей базы знаний;
(а3) не была "пустой" или избыточной.
Таким образом, обеспечение требований (а1 - а3) является важнейшей функцией модуля извлечения знаний и обучения.
Рассмотрим, как осуществляется обработка экспертной информации на примере системы диагностирования. Предположим, эксперты оценивают некоторый диагноз (гипотезу), указывая оценки правдоподобности (коэффициенты уверенности - КУ) этой гипотезы. Таким образом, каждый эксперт формирует пару (Н, КУi), гдеН - некоторая гипотеза. Если обозначить через1,2, ...,n- степени компетентности экспертов (веса), то результирующее значениеКУ*для гипотезыНполагаем равным:
(1.36)
При отсутствии информации о компетентности экспертов можно положить i= 1 .
Для оценки статистической значимости найденного значения КУ*находят дисперсию
(1.37)
и далее, задавшись вероятностью ошибки Рош, определяют вероятность(1 - Рош), с которой случайная величина попадает в интервал
[КУ* - ; КУ* + ], (1.38)
где иt - коэффициент Стьюдента, устанавливаемый из таблиц по значениюРошиn.
Другой важной задачей при экспертизе является ранжирование продукций с учетом их важности. Очевидно, что от того, насколько точно ранжированы правила, определяется эффективность стратегии вывода.
В результате процедуры ранжирования строится следующая таблица (табл. 1.4)
Таблица 1.4.
Эксперты |
Продукция | |||
|
1 |
2 |
|
m |
1 |
r11 |
r12 |
|
r1m |
2 |
r21 |
r22 |
|
r2m |
. . . n |
. . . rn1 |
. . . rn2 |
|
. . . rnm |
рангов |
r1 |
r2 |
|
r |
В нижней строке табл. 1.4 записываются суммы рангов, полученные каждой продукцией (чем больше сумма, тем продукция важнее). Результирующее упорядочение продукций осуществляется согласно оценкам ri.
Статистическая согласованность (значимость) ранжирования проверяется для случая отсутствия равных рангов в ранжировке каждого эксперта, на основании коэффициента конкордации (согласованности) W:
(1.39)
В случае нестрогого ранжирования (при наличии равных рангов) используется формула:
(1.40)
где k- число групп равных рангов, введенныхi-м экспертом;t- число одинаковых элементов вj-ой группеi-го эксперта.
Пусть значение Wнайдено. Вычисляется величинаn(m - 1)W, для которой задаются вероятностью ошибкиРош. Согласно2- распределения с(m - 1) степенью свободы дляРошнаходят табличное значениеWтаб. Если найденное значениеWWтаб, тоWсчитается статистически значимой.
Другой вариант извлечения знаний, связан с ответом системы на запросы пользователя. При этом вопрос интерпретируется как теорема, которая подлежит доказательству, а нахождение ответа на вопрос ищется на основании метода доказательства теорем. В рамках этой концепции построена система логического пропсам- минования Пролог, рассматриваемая позднее. В качестве иллюстрации рассмотрим следующий Пролог - подобный пример.
Здоровое_тело (Y)Здоровый_дух (Y).
Спортсмен (Х) & Ведет_здоровый_образ_жизни (Х) Здоровое_тело (Х).
Здоровый_дух (Z)Подходящий_партнер (Z).
Спортсмен (Сидоров).
Спортсмен (Иванов).
Спортсмен (Петров).
Здоровое_тело (Федоров).
Ведет_здоровый_образ_жизни (Петров).
Ведет_здоровый_образ_жизни (Сергеев).
Зададим вопрос системе в форме
? - Подходящий партнер (Т).
Для того, чтобы ответить на этот вопрос, система должна построить дедуктивную цепочку с чаключением в виде теоремы-вопроса. Не приводя способа построения этой цепочки, укажем ее Симу (одну ич подходящих цепочек):
Спортсмен (Петров) Ведет_здоровый_образ_жизни (Петров)Здоровое_тело (Петров)Здоровый_дух (Петров)Подходящий партнер (Петров).
Следовательно, ответом на вопрос является Т = Петров.