Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СППР

.pdf
Скачиваний:
192
Добавлен:
19.02.2016
Размер:
10.12 Mб
Скачать

69

язык (сталь) анкеты должен быть ясным, понятным, предельно вежливым.

Под интервью будем понимать специфическую форму общения инженера по знаниям и эксперта, в которой инженер по знаниям задаёт эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области.

На качество проведения интервью влияют три основных характеристики вопросов:

язык вопроса (понятность, лаконичность, терминология); порядок вопросов (логическая последовательность и

немонотонность); уместность вопросов (этика, вежливость).

Рис. 1.15. Классификация вопросов

Схема классификации вопросов приведена на рис. 1.15. Кратко рассмотрим отличительные особенности каждого типа вопросов.

70

Открытый в о п р о с называет тему или предмет, оставляя полную свободу эксперту по форме и содержанию ответа. В закрытом вопросе эксперт выбирает ответ из набора предложенных.

Личный в о п р о с касается непосредственно личного индивидуального опьгта эксперта. Безличный в о п р о с направлен на выявление наиболее распространённых и общепринятых закономерностей предметной области.

Как правило, языковые способности эксперта ограничены и часто он не может сформулировать своё мнение. Поэтому при беседе аналитик использует не только прямые в о п р о с ы , которые непосредственно указывают на предмет или тему, а и косвенные в о п р о с ы . Иногда приходится задавать множество косвенных вопросов вместо одного прямого.

Вербальные вопросы - это традиционно устные вопросы. В вопросах с использованием наглядного материала используют фотографии, рисунки, слайды и т.д.

Рис. 1.16. Подготовка к извлечению знаний

Основные в о п р о с ы направлены непосредственно на выявление знаний. Зондирующие в о п р о с ы направляют рассуждение эксперта в нужную сторону, если не сработал основной вопрос. Контрольные вопросы применяют для проверки достоверности и объективности

71

информации, получаемой в интервью. Для этого используют повторение вопросов в другой форме, уточнение, ссылки на другие источники и т.д.

Наконец, о нейтральных и наводящих вопросах. В принципе, вопросы должны носить нейтральный характер, т.е. не должны указывать на отношение интервьюера к данной теме. Напротив, наводящие вопросы заставляют респондента (эксперта) принимать во внимание позицию интервьюера.

Свободный диалог - это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в которой нет жёсткого регламентированного плана и вопросника.

Особое внимание следует обращать подготовке к диалогу. Квалифицированная подготовка помогает аналитику обеспечить гладкое течение процедуры извлечения знаний, завоевать доверие эксперт Содержание процесса подготовки к извлечению знаний приведено на рис. 1.16.

Групповые методы извлечения знаний обеспечивают возможность одновременного использования знаний нескольких экспертов, взаимодействие которых обеспечивает принципиальную новизну получаемой информации от наложения разных взглядов и позиций.

К групповым методам относятся дискуссии за "круглым столом", "мозговые штурмы" и ролевые игры.

Метод "круглого стола" предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов.

Задача дискуссии - коллективно, с разных точек зрения, под разными углами исследовать спорные гипотезы предметной области. Вначале участники высказываются в определённом порядке, а затем переходят к свободному обсуждению. Рекомендуемое число участников дискуссии - от трёх до семи [33].

От инженера по знаниям подготовка "круглого стола" требует как организационных условий (место, время, обстановка и т.д.), так и психологических усилий (способность гасить конфликтные ситуации, своевременные и умные реплики И Т.Д.).

Ход беседы удобно записывать на магнитофон, а при анализе результатов учитывать особенности поведения участников при групповом обсуждении проблемы.

"Мозговой ш ту рм " - один из наиболее распространённых методов раскрепощения и активизации творческого мышления. Основная идея штурма - это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.

Продолжительность "штурма" до 40 минут. Участникам (до 10 человек) предлагается высказать любые идеи на заданную тему (критика

72

запрещена). Регламент - до 2 минут на выступление. При анализе обычно лишь 10-15% идей оказываются разумными, но среди них есть оригинальные. Оценивает результаты группа экспертов, не участвовавших в генерации идей.

Игрой называют такой вид человеческой деятельности, который отражает (воссоздаёт) другие её виды. Экспертные игры включают деловые игры, диагностические игры и компьютерные игры.

Под деловой и г р о й понимают эксперимент,

где участникам

предлагается производственная ситуация, а

они на

основе знаний

и жизненного опыта принимают решения.

Решения

анализируются

и вскрываются закономерности мышления участников эксперимента. Из трёх основных вцдов деловых игр (учебных, планово-производственных и исследовательских) к экспертным играм ближе всего исследовательские, которые используются для анализа правил принятия решений.

1 Диагностическая игра - это та же деловая игра, но применяемая конкретно для диагностики методов принятия решений в медицине.

Компьютерные игры веб чаще применяются в обучении. Можно назвать следующие типы компьютерных игр [33]:

игры-действия (требуют хорошего глазомера и быстрой реакции); симуляторы (отработка практических навыков, например, при

вождении автомобиля, самолета и т.д.); стратегические игры (стратегическое планирование, экономическая

борьба, военные операции); приключенческие игры;

ролевые игры (борьба с противником с учётом его психологических особенностей, накопление опыта при принятии решений).

Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик, инструкций и других носителей профессиональных знаний. Среди методов извлечения знаний эта группа является наименее разработанной.

Модель любого научноготекста T может быть представлена в вице [39]:

Γ-(α,β,γ,δ,θ)Β,

где а - заимствования из других источников; β - система научных понятий в момент создания текста; γ - субъективные взгляды автора; δ - общие места, не имеющие прямого отношения к рассматриваемому вопросу; Θ - результаты наблюдений автора.

Все эти компоненты погружены в языковую среду и .

При извлечении знаний аналитику, интерпретирующему текст, приходится решать задачу декомпозиции этого текста на указанные

73

компоненты для выделения значимых для реализации базы знаний фрагментов.

Основными моментами понимания текста являются: выдвижение предварительной гипотезы о смысле всего текста;

определение значений непонятных слов (специальной терминологии);

возникновение общей гипотезы (о знаниях); уточнение значения терминов и интерпретация отдельных

фрагментов текста под влиянием общей гипотезы (от целого к частям); формирование некоторой смысловой структуры текста за счёт

установления внутренних связей между ключевыми словами и фрагментами, а также за счёт образования абстрактных понятий, обобщающих конкретные фрагменты знаний;

корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (от частей к целому);

принятие основной гипотезы.

Следует отметить наличие как дедуктивной (от целого к частям), так

ииндуктивной (от частей к целому) составляющей процесса понимания.

Вцелом, на процесс понимания (или интерпретации) текста влияют следующие компоненты:

совокупность компонентов (α,β,γ,θ), почерпнутых из текста Т\

предварительные знания аналитика о предметной области ω ; общенаучная эрудиция аналитика ε ; его личный опыт φ .

Α/ = [(α,β,γ,θ);ω,ε,φ].

Здесь M - модель смысла текста, сформированная аналитиком. Обобщённый алгоритм извлечения и структурирования знаний из

текста включает следующие шаги [33]:

1.Составление "базового" списка литературы для ознакомления с предметной областью.

2.Выбор текста для извлечения знаний.

3.Первое знакомство с текстом. Консультации со специалистами или изучение справочной литературы для определения значений незнакомых

терминов.

4.Формирование первой гипотезы о макроструктуре текста.

5.Изучение текста с определением основных ключевых слов и

выражений, т.е. выделение "смысловых вех" (компрессия текста).

6.Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или "сжатого" текста (реферата).

7.Формирование поля знаний на основании макроструктуры текста.

74

Методы извлечения знаний, рассмотренные выше, являются непосредственной подготовкой к структурированию знаний. В заключение раздела рассмотрим обобщённый алгоритм формирования поля знаний

(рис. 1.17) [33].

Рис. 1.17 Обобщенный алгоритм структурирования знаний

1. Определение входных {X} и^рыходных {У} данных. Этот шаг определяет направление движения в поле знаний - от X к Y. Кроме того, структура входных и выходных данных существенно влияет на форму и содержание поля знаний.

75

2. Составление словаря терминов и наборов ключевых слов N. На этом шаге на основе протоколов сеансов извлечения знаний выписываются все значимые слова, обозначающие понятия, явления, процессы, предметы, действия, признаки и т.п.

3.Выявление объектов и понятий {Л}. На основе обработки словаря N выбираются значимые для принятия решений понятия и их признаки. Образуется полный систематический подбор терминов в данной предметной области.

4.Выявление связей между понятиям^ и определение "силы

связности". Построение сети ассоциаций.

5.Выявление метапонятий и детализация понятий. Анализ связей позволяет структурировать понятия, выявлять метапонятия или детализировать понятия.

6.Построение пирамиды знаний, т.е. иерархической лестницы понятий, подъём по которой означает углубление понятий и повышение уровня абстракции (обобщённости) понятий.

7.Определение отношений {ДЛ} как внутри каждого из уровней пирамиды, так и между уровнями. На этом шаге даются имена тем связям, которые определены на 4 и S шагах. Обозначаются причинноследственные и другие виды отношений.

8.Определение стратегий принятия решений (S1), т.е. выявление

цепочек рассуждений, связывающих все сформированные понятия и отношения в динамическую систему поля знаний. Стратегии придают активность знаниям и обеспечивают переход от входных данных X к решению Y.

1.7.Представление знаний в СППР

1.7.1.ПОНЯТИЕ БАЗЫ ЗНАНИЙ

Сиспользованием вычислительной техники традиционно связанны такие понятия как программы и данные. Причем первые необходимы для обработки вторых. В самом начале развития вычислительной техники данные были неотъемлемой частью программ (находились непосредственно в них). Потом состоялось значительное изменение - данные были отделены от программ. Это обособление проходило в четыре этапа:

1)формирование записей данных в файлах, причем, ведение файлов и организация доступа к ним полностью определялись в конкретных программах пользователей;

2) управление файлами и организацию доступа к ним стали осуществлять операционные системы; .

3) создание интегрированных баз данных и развитие систем управления ними;

76

4) создание методов и средств распределенной обработки данных, в частности, на базе разных моделей технологии “клиент-сервер”.

Сейчас можно говорить о новом этапе в развитии технологий обработки данных - это интеграция систем управления базами данных в технологию Internet/Intranet.

Ho с появлением систем искусственного интеллекта появилось новое понятие - “База знаний” (БЗ). Возникает логический вопрос: ’’Как ясе соотнести уже обычные нам понятия “данные” и “базы данных” с новыми П0НЯ1ИЯМИ “знания” и “базы знаний”?

Бесспорно, данные и структура БД в некоторой степени отображает знания о предметной области и ее структуре. Ho существуют специфические признаки, которые отличают знания от данных [40]:

1.Внутренняя интерпретируемость. Если какие-либо данные вводятся

впамять ЭВМ, то они превращаются в машинные слова, которые имеют вид двоичного кода, определенной длины. Что скрывается за этим кодом, узнать практически невозможно. Это может быть число, любой символ, закодированное слово и т.д. Все эти данные интерпретируются машиной,

как двоичные слова. С этой точки зрения, ЭВМ “однотипно” выполняет все программы, которые в ней реализованы. Если в любое время остановить программу, то нельзя будет проанализировать, что она делала: решала дифференциальное уравнение или обрабатывала фрагмент некоторого музыкального произведения.

Отметим, что некоторые данные все-таки имеют внутреннюю интерпретацию. Этот случай относится, например, к реляционным базам данных, где имена столбцов являются атрибутами отношений, значение которых указаны в строках таблицы. Атрибуты и имена отношений дают возможность ЭВМ интерпретировать введенную в нее информацию.

2. Структурированность. Одной из фундаментальных особенностей человеческого познания Вселенной есть его способность к декомпозиции объектов, которые наблюдаются, а также умение выделять в них отдельные элементы и устанавливать связи между ними. Это позволяет человеку воспринимать любой объект как структуру. Это свойство позволяет ему представлять сложные объекты в виде совокупности более простых и познавать свойства нового объекта через свойства тех, которые входят в его структуру.

Структурированность обозначает, что соответствующие понятия оказываются объединенными между собою связями типа: “часть - целое”, “класс - элемент”, “род - вид” и т.д. Такие связи образуют иерархию понятий и разрешают вводить новые понятия, которые отвечают реальным объектам внешнего мира. Знания, которые представляются в ЭВМ, должны обладать таким же самым свойством к созданию иерархий,

77

введению новых обобщенных понятий, проводить декомпозицию понятий на составляющие их понятия и устанавливать отношения между ними.

Конечно, некоторые данные также имеют подобное свойство. Например, данные, которые сохраняются в СУБД с иерархической или сетевой моделью данных. Интересен тот факт, что в настоящее время очень большое внимание отводится так называемым информационно­ аналитическим системам, которые в свою очередь, могут быть реализованы на основе реляционных СУБД. В этом случае разрабатываются специальные методы, которые разрешают, создавать иерархии и отношения на основе информации, которая сохраняется в реляционных таблицах.

3.Связность. Сразу отметим, что для этого свойства практически нельзя найти аналогов в базах данных. Дело в том, что знания, которые сохраняет человек, связанны друг с другом не только связями в понимании структуры. Существуют другие связи. Среди них особое значение имеют те, которые устанавливают закономерности между отдельными единицами информации (фактами, процессами, явлениями), а также определяют структуру той ситуации* в рамках которой наблюдаются сущности и соответствующие им информационные единицы. Эти связи отображают закономерности фактов, процессов, явлений и причинно-следственные отношения между ними.

4.Активность. Исторически сложилось так, что во время работы на ЭВМ активными были лишь программы, а данные, которые находилось в ЭВМ, были пассивными. Они просто сохранялись в памяти и ждали, когда их начнет применять любая программа. Другая картина наблюдается со

знаниями человека. Они у него, прежде всего, активные. Это принципиально отличает их от данных. Например, выявление противоречий в знаниях становится причиной их преодоления и появление новых знаний. Другим стимулом активности является неполнота или нечеткость знаний, так как она требует их дополнения.

Остановимся на нескольких рабочих определениях, которые наиболее точно дают понимание различия данных и знаний.

Данные - это отдельные факты, которые характеризуют объекты, процессы и явления предметной области, а также их свойства и характеристики.

Наиболее точное и полное определение базы данных дано в [41]. База данных - совокупность взаимосвязанных хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений, причем данные запоминаются так, чтобы они были независимы от программ, использующих эти данные, а для добавления новых или модификации существующих данных, а также для поиска

78

данных в базе данных используется общий управляемый способ. При этом данные структурируются таким образом, чтобы была обеспечена возможность дальнейшего наращивания приложений, работающих с базой данных.

Знания - это некоторые закономерности предметной области (принципы, отношения, связи, законы), которые получены в результате мыслительной и практической деятельности человека и позволяющие специалистам ставить и решать задачи в этой области на ЭВМ.

Другое, более лаконичное и точное определение знаний дано в [40]. Знания - это система понятий, отношений между понятиями и зависимостей между отношениями и понятиями.

Например, множество понятий П = {электрический ток, проводник, число}, множество отношений О = {/ - сила тока, U - напряжение, R - сопротивление проводника}, множество зависимостей = {I=U/R}.

Определение базы знаний, такое точное и полное, как определение базы данных, найти трудно. Чаще всего, под базой знаний понимают совокупность хранящихся в ЭВМ знаний и моделей их представления.

Всвою очередь, под банком знаний понимается совокупность баз знаний и набора инструментальных средств формирования и управления ними.

Вобщем, четкую грань между данными и знаниями провести можно не всегда. Ho все-таки она существует и это, в свою очередь, привело к появлению специальных методов и моделей представления знаний в ЭВМ, которые отобразили все четыре характерных признака знаний.

1.7.2.МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

Внастоящее время существуют десятки моделей представления знаний в различных предметно-ориентированных областях, однако,

большинство из них сводится к следующим типам:

1)семантические сети;

2)фреймы;

3)продукционные системы;

4)формальные логические модели (языки).

Характерным для всех них есть Однородность представления знаний, а также простота и наглядность их понимания.

Семантические сети

Данная модель представления знаний была предложена американским психологом Кушшианом [42]. Термин семантическая означает "смысл", а семантика - это наука, которая устанавливает отношения между символами и объектами, которые они обозначают. Понятие семантической сети основано на древней идее о том, что "человеческая память" Формируется через ассоциации между понятиями. Понятие "ассоциативная