Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие (Интеллектулльные информационные технологии) (ТГУ).doc
Скачиваний:
360
Добавлен:
19.03.2016
Размер:
3.8 Mб
Скачать

Глава 5. Теоретические основы инженерии знаний

5.1. Процедура извлечения знаний

Центральным понятием на стадиях получения и структурирования знаний является «поле знаний» Pz (п. 2.1) – условное нормальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы эксперта в виде текста, графа, диаграммы или таблицы. Поле знаний представляет собой модель знаний о предметной области в том виде, в каком ее сумел выразить аналитик на некотором языке L, который должен обладать свойствами [2.8]:

  • максимальная точность – идеал точности, это язык математики, минимальная точность – естественный язык;

  • однозначность терминов;

  • L либо символьный, либо графический язык.

Учение от символах получило название «семиотика». В последнее время сложилась новая ветвь – «прикладная семиотика». Семиотика включает: синтаксис – совокупность правил построения языка или отношения между знаками; семантику – связь между элементами языка и их значениями или отношения между знаками и реальностью; прагматику – отношения между знаками и их пользователями, отражает практические разработки и использования Pz.

При формировании Pz ключевым является сам процесс получения знаний, когда происходит перенос компетентности экспертов на когнитологов. Извлечение знаний – это процедура взаимодействия эксперта с когнитологом, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. При построении промышленной ЭС процесс извлечения знаний является самым «узким» местом, поскольку приходится преодолевать трудности [2]: организационные неувязки; неудачный метод извлечения, не совпадающий со структурой знаний в данной области; неадекватная модель для представления знаний; неумение наладить контакт с экспертом; терминологический разнобой; отсутствие целостной системы знаний в результате извлечения только «фрагментов» знаний и т.д.

Процесс извлечения знаний– это длительная и трудоемкая процедура, когда когнитологу необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения.

Приобретение знаний представляет собой процесс наполнения БЗ экспертом с использованием специализированных программных средств при прямом контакте с ЭС.

Формирование знанийявляется процессом анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств [9]. Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификации и распознавания образов. Извлечение, приобретение и формирование знаний определяют три основные стратегии получения знаний (рис. 5.1) [2].

С применением

компьютера

Без применения

компьютера

Формирование

знаний

Приобретение

знаний

Извлечение

знаний

Рис. 5.1. Стратегии получения знаний

5.2. Основные аспекты извлечения знаний

Процедура извлечения знаний включает психологический, лингвистический и гносеологическийаспекты. Психологический является ведущим, поскольку определяет успешность и эффективность взаимодействия когнитолога с экспертом.

Извлечение знаний происходит через общение, которое является процессом выработки новой информации, общей для общающихся людей и рождающей их общность. Можно выделить следующие структурные компоненты модели общения при извлечении знаний: участники общения (партнеры); средства общения (процедура); предмет общения (знания). В соответствии с этой структурой выделяются три слоя психологических проблем, возникающих при извлечении знаний: контактный, процедурный и когнитивный.

Разработка проблематики контактного слоя позволила выявить параметры партнеров, влияющие на результаты извлечения знаний:

  • пол, возраст – хотя и влияют на эффективность контакта, но не являются критическими;

  • личность, под которой понимается устойчивая система психологических черт, характеризующая индивидуальность человека: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность, находчивость;

  • темперамент(холерик, сангвиник, меланхолик, флегматик). Известно, что флегматики и меланхолики медленнее усваивают информацию. Их не надо торопить с ответом, задавать быстрый темп диалогу. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации;

  • мотивация, которая определяет стремление к успеху. Когнитолог должен изыскать различные стимулы для эксперта, в т.ч. и материальные. Знания – один из самых дорогих продуктов, и их отторжение от эксперта должно быть вознаграждено.

Параметры процедурного слоя описывают непосредственно процесс процедуры извлечения знаний и являются по сути профессиональными:

  • ситуация общенияопределяется местом проведения бесед с экспертом, продолжительностью и временем их проведения. Желательно проводить беседы с экспертом наедине, продолжительностью не более двух часов в первой половине дня;

  • оборудованиевключает вспомогательные средства (наглядный материал, средства протоколирования), освещенность, мебель;

  • профессиональные приемы когнитолога (темп, стиль, методы). Учет индивидуального темпа эксперта позволяет когнитологу снизить напряженность процедуры извлечения знаний. Лучше всего человек воспринимает предложения из 5-9 слов. Это письмо получило название Ингве-Миллера (мера «разговорности» речи). Большая часть информации поступает к когнитологу в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи, которая гораздо богаче и многообразнее. При этом для передачи этой внутренней речи эксперт использует и невербальные средства (интонация, мимика, жесты). Методы извлечения знаний проанализированы ниже (п. 5.3).

Наименее исследованы в настоящее время проблемы когнитивного слоя, связанные с изучением семантического пространства памяти эксперта и реконструкцией его понятийной структуры и модели рассуждений. Основными факторами, влияющими на когнитивную адекватность, являются:

  • когнитивный стиль,под которым понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека (поленезависимость, импульсивность, ригидность, когнитивная эквивалентность). Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи. Под импульсивностью понимается быстрое принятие решения в противоположность рефлексивности. Эксперту и когнитологу желательно быть рефлексивными. Ригидные люди не склонны менять свои представления и структуру восприятия, что для когнитологов нежелательно. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы;

  • семантическая репрезентативность Pz и концептуальной модели подразумевает подход, исключающий традиционное навязывание эксперту некой модели представления знаний, и заставляет когнитолога последовательно воссоздавать модель мира эксперта. Проблема семантической репрезентативности ориентирована на достижение адекватностиPzи концептуальной модели. Лингвистический аспект извлечения знаний касается исследований языковых проблем и включает 3 слоя:

  • «общий код»решает проблему «языковых ножниц» между профессиональной терминологией эксперта и обычным языком когнитолога, включая компоненты: общенаучная терминология, элементы бытового языка, неологизмы, профессиональный жаргон (рис.5.2).

В дальнейшем «общий код» преобразуется в некоторую семантическую сеть, которая является прообразом Pzпредметной области;

  • понятийная структурапредполагает построение иерархической сети понятий или «пирамиды знаний». Задача когнитолога на данном слое заключается в построении фрагментов БЗ «сшивания» терминов»;

  • словарь пользователяобеспечивает «прозрачность» и доступность ЭС для конечных пользователей.

Рис. 5.2. Структура «общего кода»

Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулирует некоторые закономерности из личного опыта. Инженерия знаний как наука дважды гносеологична – сначала действительность отражается в сознании эксперта, а затем опыт эксперта интерпретируется сознанием когнитолога в поле знаний, служащее основой построения ЭС. Гносеологическую цепочку можно представить в виде: факт обобщенный фактэмпирический законтеоретический закон. Основными методологическими критериями научности, позволяющими считать научным и само новое знание и способ его получения, являются:

  • внутренняя согласованность, определяющая характеристики эмпирического знания (модальность, противоречивость, неполнота). Модальность знания означает возможность его существования в различных категориях, т.е. в конструкциях существования и долженствования – часть закономерностей возможна, часть обязательна. Кроме того, необходимо различать такие оттенки модальности, как: эксперт знает, что…; эксперт думает, что…; эксперт хочет, чтобы…; эксперт считает, что… .Противоречивость эмпирического знания – естественное следствие из основных законов диалектики, и противоречия должны разрешатьсяPz, а напротив именно противоречия служат чаще всего отправной точкой в рассуждениях эксперта. Неполнота знания связана с невозможностью полного описания предметной области;

  • системностьориентирует эксперта на рассмотрение предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической организации любого объекта, т.е. все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков), и, наоборот, любые объекты можно рассматривать как элементы более высоких классов обобщений;

  • объективностьявляется труднодостижимым методологическим критерием, поскольку процесс познания глубоко субъективен, т.е. существенно зависит от особенностей эксперта. Субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объектов. Следовательно, более корректно говорить о глубине понимания, чем об объективности знания;

  • историзм– этот критерий связан с развитием. Познание настоящего есть познание породившего его прошлого. Большинство ЭС дают «горизонтальный» срез знаний – без учета времени (в статике). Тем не менее когнитолог должен рассматривать изучаемые процессы с учетом временных изменений.

Методологическая структура познания может быть представлена как последовательность этапов: описание и обобщение фактов; установление логических и математических связей, дедукция и индукция законов; построение идеализированной модели; объяснение и предсказание явлений.