Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.docx
Скачиваний:
332
Добавлен:
17.02.2016
Размер:
781.66 Кб
Скачать

11.4. Проверка информации эксперта и гипотезы о характерности

Как отмечалось, не ошибающихся экспертов не бывает. Поэтому информацию эксперта следует подвергать проверке, основанной на использовании условий доминирования по характерности.

Формально такую проверку можно представить следующим образом. Пусть на каком-то этапе диалога «компьютер—эксперт» состояние а i было отнесено к классу P j : а i I Р i . После каждого ответа эксперта осуществлялось распространение по доминированию. Построенные конусы доминирования по характерности в общем случае пересекаются. Это означает, что некоторые состояния могут быть классифицированы несколько раз. Предположим, что при этом классификации какого-то состояния a v различаются. Тогда, например, ( a v , a j ) I D pi , но a j I P 1 , т.е. a v более характерно для класса Р i , чем a j , однако a v оказалось отнесенным (при другом ответе эксперта) к классу Р l . Этот факт может быть как ошибкой эксперта, так и проявлением зависимости диагностических признаков.

При выявлении противоречия в классификации компьютер предъявляет эксперту на экране описания двух состояний и просит еще раз их проанализировать. Если эксперт обнаруживает свою ошибку, он ее устраняет и опрос продолжается. Если эксперт подтверждает обе противоречивые классификации, то:

• с помощью эксперта выделяется подмножество зависимых диагностических признаков;

• эти признаки объединяются в один агрегированный признак, не зависящий от остальных.

Аналитические оценки показывают, что в среднем около 25% ответов экспертов проверяются, что позволяет считать созданную базу знаний непротиворечивой и надежно отражающей экспертные знания.

11.5. Определение последовательности состояний для предъявления эксперту в процессе классификации

Как было показано выше, классификация состояния объекта исследования позволяет косвенно классифицировать ряд других состояний (либо уменьшить неопределенность). Это дает возможность построить полную классификацию, т.е. решить поставленную задачу, предъявив эксперту сравнительно небольшое число состояний. Для реализации такой возможности необходимо найти стратегию выбора очередного состояния для предъявления эксперту.

Система КЛАСС [7], а также последовавшие за ней системы ДИФКЛАСС [13], СТЕПКЛАСС [14] и КЛАНШ [15] отличаются друг от друга стратегией предъявления состояний эксперту.

Так, в системе КЛАСС осуществляется выбор наиболее информативного состояния. Предпрлагается, что все возможные ответы эксперта для любого неизвестного состояния объекта равновероятны. Для каждого неклассифицированного состояния вычисляются количества косвенно классифицируемых состояний при всех возможных ответах эксперта. Далее под-считывается среднее количество, которое и характеризует информативность предъявления конкретного вектора. Компьютер осуществляет перебор всех неквалифицированных на данный момент состояний и выбирает то, для которого ожидаемое среднее количество косвенно классифицированных состояний максимально.

Существенно более эффективными (по числу обращений к эксперту) являются методы ДИФКЛАСС и КЛАНШ.

11.6. Трудоемкость построения баз знаний

Компьютерные системы построения полных и непротиворечивых баз знаний ставят эксперту вопрос за вопросом до тех пор, пока все состояния (все векторы a i из множества А) не будут отнесены к одному или нескольким классам. Для создания таких баз знаний требуется от одной—двух недель до одного— двух месяцев работы с опытным экспертом (в зависимости от объема базы знаний).

Приведем конкретные данные по системе КЛАСС [7]. Для создания базы знаний по семи коматозным заболеваниям (классифицируются 2304 состояния пациента) потребовалось 12 ч работы эксперта, по 14 болезням, начинающимся с болевого синдрома в области живота (около 20 тыс. состояний), — 60 ч. Разработка первой базы знаний заняла примерно семь дней, второй — около месяца.

Система ДИФКЛАСС позволяет классифицировать в среднем до 700 состояний объекта исследования в час [13].