Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СППР

.pdf
Скачиваний:
192
Добавлен:
19.02.2016
Размер:
10.12 Mб
Скачать

59

предусмотрена соответствующая стратегия информационного обмена. В качестве такой стратегии предлагается использовать стратегию распределённого решения задач [32]. Рассмотрим алгоритм реализации указанной стратегии.

Пусть задача S поступила на некоторую СППР Y0.

Шаг 1. СППР Y0 декомпозирует исходную задачу S . Пусть в

результате декомпозиции задачи образовалось Si подзадач, где г = 0,...,«.

Шаг 2. СППР Y0 проверяет на противоречивость множество S0. Если 50 противоречиво, процесс завершается - исходная задача S0 не имеет

решения. Иначе СППР Y0 определяет дочерние СПГІР Yi и пересылает им

задіти Si (/' = 1,...,п) для решения.

Шаг 3. СППР Y1 (і = 1,-..,и) проверяют на противоречивость множества Si Q0 (/ = 1,и), где Θ0 - решение задачи S0. Результаты решения этих задач СППР Yi пересылаются в СППР У0.

Шаг 4. Если СППР Y0 определила, что все проверяемые множества противоречивы, то переходим к шагу 5. Иначе исходная задача S решения

не имеет.

 

СППР Y0 формируется

комбинация Qln решений

Шаг S.

В

0 ,,02,...,0 ,

и процесс завершается.

0 ,„

-

решение исходной задачи.

Если комбинации

0 не существует,

скажем,

из-за решения множества

Sn 0 О, то формируется комбинация 0 1іЛЧ решений 0 ,,0 2 ,...,0Я_, и она пересылается в СППР Yn.

Шаг 6. В СППР Yn проверяется на противоречивость множество

Sn-On.,. Если это множество противоречиво, то процесс прекращается. Это решение и будет решением исходной задачи S. Иначе решение 0 Я

пересылается в СППР Yi (i = 1,...,и - 1).

Шаг 7. В СППР Y1 (і = Ι,...,η- l ) проверяются на противоречивость множества Si Qn. Если они противоречивы, то каждой СППР Yi

пересылается решение задачи Si - 0„ в СППР У0.

Шаг 8. В СППР У0 формируется комбинация 0 из решений задач

51 0„ (/ = 1,...,я-1) и завершается работа. Комбинация 0 - это решение задачи S .

Таким образом, концепция доски объявлений - это удобный способ слабого связывания локальных СППР для обеспечения возможности разрешения конфликтов и автономного их функционирования.

60

1.6 Теоретические и практические вопросы инженерии знаний

1.6.1. ЭЛЕМЕНТЫ ТЕОРИИ ИНЖЕНЕРИИ ЗНАНИЙ

Практика проектирования и использования СППР показывает, что их эффективность определяющим образом зависит от полноты и достоверности экспертных знаний, хранящихся в базе знаний СППР. Сколь бы хороши не были средства обработки знаний, они не могут компенсировать недостатки формирования базы знаний.

Формирование базы знаний является одной из центральных проблем проектирования СППР. Как указывается в работе [33J, принципиальные трудности, возникающие при решении этой проблемы, заключаются в следующем.

1.Набор факторов, как правило, очень велик, что вызывает необходимость анализа экспертом большого количества ситуаций. В то же время получение лишь части знаний эксперта не позволяет получить полное описание предметной области.

2.Любой эксперт знает больше, чем может сформулировать и объяснить. Иначе говоря, способность эксперта представить свои знания в виде чётких правил и алгоритмов всегда ограничена.

3.Передача знаний экспертом невозможна без потери информации и ошибок. Так, в [33] показано, что при разговорном общении инженер по знаниям может получить от эксперта не более 24 % информации, которую эксперт хотел бы осознать, сформулировать и передать.

При формировании базы знаний СППР необходимо ответить на 3 вопроса: что такое знания, откуда их можно получить и каким образом

рационально это сделать.

Для ответа на первый вопрос введено понятие "поле знаний" [33], под которым понимается условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта в виде алгоритма, графа, диаграммы, таблицы, текста и т.д.

Поле знаний представляет собой модель знаний о предметной области (ПО) в том виде, в каком её сумел выразить аналитик (эксперт, инженер по знаниям) на некотором "своём" языке. Общие требования к этому языку заключаются в следующем [33].

1. В языке должно быть как можно меньше неточностей, присущих обыденным языкам, что достигается, прежде всего, строгим определением понятий.

2.Желательно не использовать в нём терминов иных наук в новом смысле во избежание недоразумений.

3.Предпочтительно, чтобы язык был либо символьным, либо графическим (схемы, рисунки, пиктограммы и др.).

61

Наиболее перспективными языками, удовлетворяющими указанным требованиям, являются языки семиотического моделирования [34,35]. Семиотическая модель поля знаний может быть представлена как граф, рисунок, таблица, диаграмма, формула или текст и включает в себя традиционно синтаксис (совокупность правил построения языка или отношения между знаками); семантику (связь между элементами языка и их значениями или отношения между знаками и реальностью); прагматику (отношения менаду знаками и их пользователями).

Перенос компетентности экспертов на инженеров по знаниям обеспечивается путём реализации процесса получения знаний. Для названия этого процесса в литературе по экспертным системам используется несколько терминов: приобретение (acquisition), получение, извлечение, выявление (elicitation), формирование знаний.

В работе [33} совершенно справедливо в процессе получения знаний выделяют также в его отдельные этапы как извлечение знаний, так и приобретение знаний и формирование знаний.

Извлечение знаний (knowledge elicitation) - это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

Процесс извлечения знаний остаётся самым "узким” местом при построении экспертных систем и систем поддержки принятия решений. Пря этом подчёркиваются следующие трудности реализации этого процесса: организационные неувязки; неудачный метод извлечения, не совпадающий со структурой знаний в предметной облает; неадекватный язык для описания знаний; неумение наладить контакт с экспертом; терминологический разнобой; извлечение "фрагментов", а не целостной системы знаний; упрощение знаний и др.

Термин "приобретение знаний" предполагает использование автоматазированных систем прямого общения с экспертом. Приобретение знаний {knowlidge acquisition) - процесс: наполнения базы знаний экспертом с использованием специализированных программных средств.

Наконец, термин "формирование знаний" традиционно закрепился за областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения.

Формирование знаний (machine learning)- процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.

На рис. 1.12 приведена схема, иллюстрирующая описанные выше стратегии получения знаний [33].

62

Рассмотрим более подробно процесс извлечения знаний. В процедуре извлечения знаний принято выделять три аспекта: психологический, лингвистический и гносеологический.

При рассмотрении психологического аспекта, Определяющего успешность и эффективность взаимодействия инженера по знаниям с экспертом-профессионалом, выделяют три структурные компоненты модели общения при извлечении знаний: участники общения (партнёры), средства общения (процедура) и предмет общения (знания). Соответственно выделяются три "слоя" психологических проблем: контактный, процедурный, когнитивный.

Рис. 1.12. Стратегии получения знаний

При изучении проблемы контактного слоя оказалось, что на результаты процедуры извлечения знаний влияют следующие параметры партнёра: пол, возраст, личность, темперамент, мотивация. В частности, наиболее полезны для извлечения знаний такие свойства личности эксперта, как доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, собранность, настойчивость, общительность, находчивость. Наиболее успешно передают знания сангвиники и холерики. На эффективность выявления знаний влияет также и мотивация. Инженер по знаниям должен изыскивать разнообразные стимулы для экспе.ртов, включая материальные.

Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Процедура характеризуется параметрами самой ситуации общения, используемым оборудованием и профессиональными приёмами аналитика.

Ситуация общения характеризуется местом, временем и продолжительностью проведения сеансов.

63

Оборудование включает вспомогательные средства (наглядный материал и средства для протоколирования результатов), мебель, средства для ©свещения и др.

Профессиональные приёмы аналитика включают, в частности, темп и стиль Проведения экспертизы, а также методы её проведения.

Когнитивные (cognition - познание) науки исследуют познавательные процессы человека с позиций возможности их моделирования. Под когнитивным стилем человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Основными характеристиками когнитивного стиля являются: полезависимосгь - поленезависимость,; импульсивность - рефлексивность; ригидность - гибкость; когнитивная эквивалентность.

Полинезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи. Под импульсивностью понимается быстрое принятие решения (часто без достаточного обоснования), а под рефлексивностью - склонность к рассудительности (способность к формированию понятий и выбору продуктивных стратегий решения задач). Ригидность - гибкость характеризует способность человека к изменению мнения в соответствии с изменением обстановки. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы.

Важнейшей проблемой извлечения знаний является проблема семантической репрезентативности (адекватности) поля знаний и концептуальной модели ПО. Возможные трансформации и потери в цепи передачи информации от эксперта к аналитику выглядят следующим образом [36]:

(O g-. предметная область или реальный мир) -> [Ti: интерпретация г-го эксперта] ->■

(Mgi: модель мира эксперта) ->

[Vi: вербализация модели мира эксперта] ->

(Tj V Ci: вербальные и невербальные сообщения г-го эксперта у'-му аналитику) -»

[I/. их интерпретацияj -м аналитиком] (Mgj: модель мира _/-го аналитика) -»

[К/, кодирование при формировании поля знаний с последующей структуризацией в концептуальную модель].

Здесь круглые скобки определяют понятия, а квадратные - процессы. Лингвистический аспект касается языковых проблем, поскольку

язык - основное средство общения в процессе извлечения знаний.

64

В инженерии знаний выделяют три слоя лингвистических проблем: "общий код", понятийная структура, словарь пользователя.

"Общий код" решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям.

Язык инженера по знаниям состоит из трёх компонентов: общенаучной терминологии, терминов предметной области и бытового разговорного языка. Язык эксперта включает общенаучную терминологию, специальную терминологию предметной облаете, бытовой язык, неологизмы, т.е. профессиональный жаргон.

Схема формирования структуры общего кода приведена на рис. 1.13. Формирование понятийной структуры обусловлено взаимосвязью понятий в памяти человека и наличием семантической сета, объединяющей отдельные термины во фрагменты, фрагменты в сценарии и т.д. Построение иерархической сети понятий ("пирамиды знаний") - важнейшее звено в проектировании интеллектуальных систем. Лингвистическая работа инженера по знаниям на данном слое сводится к формированию иерархии понятий и построению на их основе связанных

фрагментов знаний.

Рис. 1.13. Структураобшего кода

Наконец, несколько слов о словаре пользователя. Часто профессиональный уровень конечного пользователя не позволяет ему применить специальный язык предметной области в полном объёме. Необходимы специальные приёмы, увеличивающие доступность системы. Для разработки пользовательского интерфейса требуется доработка словаря общего кода с поправкой на доступность системы.

65

В заключение описания процесса извлечения знаний рассмотрим его гносеологический аспект.

Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку, при создании базы знаний эксперт часто впервые формулирует некоторые закономерности, составляющие его личный опыт. .

Системная методология познания базируется на построении гносеологической цепочки: факт -* обобщенный факт -> эмпирический закон -» теоретический закон. При этом структура самого знания включает два уровня: эмпирический (наблюдения, явления) и теоретический (законы, абстракции, обобщения).

Основными критериями научности знаний являются внутренняя согласованность, системность, объективность, историзм [37].

Внутренняя согласованность эмпирического знания характеризуется такими его свойствами как модальность^противоречивость, неполнота.

Модальность знания означает его существование в различных категориях. Существуют следующие оттенки модальности: эксперт знает,

что

эксперт думает, что

эксперт хочет,

чтобы

эксперт считает,

что....

 

 

 

 

 

 

 

Возможная

противоречивость

-

естественное

свойство

эмпирического знания. Именно противоречия служат часто отправной точкой в рассуждениях экспертов.

Неполнота знания связана с невозможностью полного описания предметной области. Неполнота может быть уменьшена либо путём сужения границ предметной области, либо введением ряда допущений.

Системно-структурный подход к познанию ,ориентирует аналитика на рассмотрение предметной области с позиции системного целого и взаимодействия составляющих его частей. Системный взгляд на струкіурирование знаний позволяет определить их иерархическую организацию.

Объективность знания определяется глубиной понимания предметной области, т.е. процессом истолкования объекта с точки зрения субъекта - эксперта.

Наконец, историзм - это необходимость рассмотрения процессов с учётом их временных изменений. Структура базы знаний должна допускать подстройку и коррекцию, как в период разработки, так и в период эксплуатации СППР. s

В заключение раздела рассмотрим структуру познания. С позиции инженера по знаниям формирование этой структуры включает следующие этапы: описание и обобщение фактов; установление логических и математических связей; построение идеализированной модели; объяснение и представление явлений.

66

На первом этапе производится сбор и предварительная систематизация фактов, как первые шаги концептуализации.

На втором этапе инженер по знаниям, используя логическую и ассоциативную модели мышления, пытается выявить схему рассуждений эксперта. При этом он использует основные операции традиционной логики: определение, сравнение и различение, анализ, "абстрагирование, обобщение, классификацию, категоризацию, образование суждений, умозаключение и т.д.

Теория ассоциаций представляет мышление как цепочку идей, связанных общими понятиями. Основными операциями такого мышления являются: ассоциации, приобретённые на основе различных связей; воспоминание прошлого опыта; пробы и ошибки со случайными исходами; "автоматические" реакции и т.д.

Большой интерес для инженерии знаний представляет гештальтпсихология. Под гештальтом (от нем. Gestalt) понимается принцип целостности восприятия - как основа мышления. Базисом для понимания процессов и явлений, таким образом, становится некоторый целостный образ или структура.

Для инженера по знаниям это означает, что, выявляя различные фрагменты знаний, он должен думать о главном, о гештальте фрагмента, который влияет на остальные компоненты и связывает их в единую структурную единицу.

Третий этап - построение идеализированной модели. Для этого необходим специализированный язык, который создаётся постепенно с помощью категориального аппарата, принятого в предметной области, а также формально - знаковых средств логики и математики. Инженеру по знаниям необходимо овладеть такими гносеологическими приёмами, как идеализация, оірубление, абстрагирование, которые позволяют адекватно отображать в модели предметную область.

Объяснение и предсказание моделей - завершающий этап в формировании структуры модели предметной области. Если модель полна и объективна, то на её основании можно делать прогнозы и принимать решения. Большинство баз знаний разрабатывается лишь до уровня идеализированной модели, однако возможность прогнозирования развития событий существенно повышает эффективность СППР.

1.6.2.КРАТКИЙ ОБЗОР

МЕТОДОВ ПРАКТИЧЕСКОГО ИЗВЛЕЧЕНИЯ ЗНАНИЙ

Основной принцип деления методов практического извлечения знаний связан с источником знаний. Исходя из этого принципа на рис. 1.14 приведена классификация методов извлечения знаний [33].

67

Коммуникативные методы извлечения знаний охватывают методы и процедуры контактов инженера по знаниям с непосредственным источником знаний - экспертом.

Текстологические методы включают методы извлечения знаний из документов (методик, пособий, руководств и т.д.) и специальной литературы (статей, монографий, учебников).

В свою очередь, коммуникативные методы делятся на две группы: активные и пассивные.

Пассивные методы извлечения знаний включают такие методы, где ведущая роль в процедуре извлечения фактически передаётся эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время работы по принятию решений.

Рис. 1.14 Классификация методов извлечения знаний

Согласно классификации (см. рис. 1.14) к этой группе относятся наблюдение, анализ протоколов "мыслей вслух", лекции.

68

При методе наблюдения инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности.

При подготовке к сеансу эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия. Во время сеанса аналитик записывает все действия эксперта-и его пояснения. Рекомендуется использовать магнитофонную запись и видеозапись в реальном масштабе времени. Протоколы наблюдений после сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.

Метод протоколирования "мыслей вслух" заключается в том, что эксперта просят не только прокомментировать свои действия и решения, но и объяснить, как это решение было найдено. Иногда этот метод называют "вербальные отчёты".

Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для человека объяснить, как он думает, поскольку известно, что люди не всегда в состоянии достоверно описывать мыслительные процессы.

Метод извлечения знаний в форме лекций используется в начале разработки базы знаний СППР как эффективный метод быстрого погружения инженера по знаниям в предметную область. Курс лекций обычно очень короткий и не превышает 2-5 лекций продолжительностью до 1,5 часов каждая. Общие требования к содержанию лекций и рекомендации по их конспектированию и изучению достаточно известны

(например, [38]).

Суть активных методов извлечения знаний заключается в том, что инициатива находится полностью в руках инженера по знаниям, который активно контактирует с экспертом различными способами.

К основным индивидуальным активным методам можно отнести анкетирование, интервью, свободный диалог и игры с экспертом.

При анкетировании инженер по знаниям заранее составляет вопросник или анкету, размножает её и использует для опроса нескольких экспертов. Эксперт самостоятельно заполняет анкету после предварительного инструктирования.

Особое внимание следует уделять составлению анкеты. Общими рекомендациями при составлении анкеты являются следующие:

анкета не Д9лжна быть монотонной и однообразной, что достигается вариацией формы вопросов;

анкета должна быть приспособлена к языку экспертов; последЪвательностъ вопросов должна быть строго продумана; необходимо стремиться к оптимальной избыточности вопросов - при

их минимальном количестве в любом случае анкета должна содержать так называемые контрольные вопросы;