Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб_12_Базы_знаний.pdf
Скачиваний:
9
Добавлен:
14.03.2015
Размер:
428.57 Кб
Скачать

1. Теоретическая часть

База знаний — это совокупность моделей, правил и факторов (данных), порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области. Базы знаний позволяют выполнять рассуждения не только и не столько на основе формальной (математической) логики, но и на основе опыта, фактов, эвристик, т.е. они приближены к человеческой логики [1].

В плане реализации база знаний (БЗ) (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний [16].

Системой баз знаний ( СБЗ ) называют систему, обеспечивающую создание и использование баз знаний [14]. Ее рассматривают как инструментальную систему, называемую также системой управления базами знаний ( СУБЗ ), или как прикладную систему с конкретной прикладной базой знаний. К этому термину близок по смыслу термин "экспертная система" ( ЭС ) . В нем акцент делается на знания экспертов, то есть специалистов в определенной области. Фактически ЕС – это система, обеспечивающая создание и использование с помощью вычислительной машины баз знаний экспертов, то есть по сути то же, что СБЗ .

Еще одна пара терминов, близких по содержанию к СБЗ, связанная с заменой слова "знание" на "интеллект" – "интеллектуальная система" или "система искусственного интеллекта".

Анализируя схемы типовых ЭС или СБЗ, можно выделить в них три основных части: базу знаний (БЗ), механизм получения решений (МПР) и интерфейс (ИФ).

Каждая из этих частей может быть устроена по-разному в разных системах, причем различия могут быть как в деталях, так и в принципах. Кроме того, между этими частями нет абсолютной границы, их разграничение достаточно условно, они могут "пересекаться".

Во многих ЭС и СБЗ содержимое базы знаний разделяют на "факты" и "правила", причем факты играют роль элементарных "единиц знания" (простых утверждений о характеристиках объектов), а правила служат для выражения связей, зависимостей между фактами и их комбинациями.

3

В системах баз данных такому делению соответствует разделение на объекты и связи, принятое во многих концептуальных моделях данных. База данных содержит не только "факты" (записи объектов с их атрибутами), но и связи, то есть она не ограничивается "фактуальными знаниями". Следовательно, традиционную БД можно рассматривать как своеобразную базу неалгоритмических знаний (о текущей ситуации в той реальной обстановке, которую эта БД моделирует) [8].

Прямое использование знаний из БЗ для решения задач обеспечивается механизмом получения решений (МПР) – второй основной частью СБЗ, называемой также механизмом, или машиной вывода, процедурой поиска, планирования, решения и т.д. МПР дает возможность извлекать из БЗ ответы на вопросы, получать решения задач, формулируемых в терминах понятий, хранящихся в БЗ.

Обычно это "частные" задачи и вопросы такого рода:

"дано то-то, найти то-то";

"найти объекты, удовлетворяющие такому-то условию";

"какие действия выполнить в такой-то ситуации".

Механизм логического вывода – неотъемлемая часть системы , основанной на знаниях (ЭС), которая реализует функции вывода (формирования) умозаключений (новых суждений) на основе информации из базы знаний и рабочей памяти [3]. Для работы механизма логического вывода необходима как "долгосрочная" информация, содержащаяся в базе знаний в выбранном при разработке ЭС виде, так и "текущая" оперативная информация, поступающая в рабочую память после обработки в лингвистическом процессоре запроса пользователя. Таким образом, база знаний отражает основные (долговременные) закономерности, присущие предметной области. Запрос пользователя, как правило, связан с появлением каких-либо новых фактов и/или с возникновением потребности в их толковании.

Механизмы логического вывода в различных системах отличаются друг от друга, что, в первую очередь, определяется выбранной моделью представления знаний.

Например, процедура логического вывода в системах, основанных на продукционных моделях, как правило, включает следующие части:

(базу данных) – фактические данные, описывающие возможное и текущее состояние предметной области;

4

базу продукционных правил, содержащую все допустимые зависимости между фактами предметной области;

механизм логического вывода.

Механизм логического вывода обеспечивает формирование заключений, воспринимая вводимые факты как элементы правил, отыскивая правила, в состав которых входят введенные факты, и актуализируя те части продукций, которым соответствуют введенные факты.

В то же время в сетевых системах механизм логического вывода основан на использовании двух ведущих принципов: наследования свойств и сопоставления по совпадению [3]. Первый принцип базируется на учете важнейших связей, отражаемых в семантической сети, к кот о- рым относятся связи: "есть", "является" (англ. IS-A) и "имеет часть", "является частью" (англ. PART-OF).

Последовательно переходя от одного узла сети к другому по направлению соответствующих связей, система выявляет (извлекает) новую информацию, характеризующую тот или иной узел.

В данной лабораторной работе используется учебная система, механизм логического вывода в которой базируется на теореме Байеса. Такой механизм очень часто применяется в диагностических системах, которые широко применяются в различных областях человеческой деятельности (медицине, технике, экономике и т.п.). Чаще всего в подобного рода системах используются продукционные модели знаний. Однако, если имеется возможность использования в правилах статистических данных о понятиях и связях между ними, целесообразно применить теорему Байеса для пересчета апостериорных вероятностей по результатам проверки наличия тех или иных симптомов.

Системы, построенные по такому принципу (т.е. вывод которых базируется на теореме Байеса), обычно используют следующую схему формализации:

• имеется множество возможных, , …гипотез, ;

• каждой гипотезе приписывается априорная вероятность

( ), ( ), … , ( ); ( ) = ;

=

• каждая гипотеза проявляется, через, … , признаки; (симптомы) 5

причем каждая гипотеза характеризуется "своими" признаками из

"общего" списка: ,

= , , … , ; = , , … , ;

известны условные вероятности проявления признаков (симптомов) для каждой гипотезы.

Тогда можно определить апостериорные вероятности каждой гипоте-

 

( )

 

( )

зы при существовании конкретного признака (симптома).

=

 

 

 

=

 

 

 

причем при расчете

 

∑= ⁄ ( )

 

 

апостериорной

вероятности учитывается,

наблюдался ли данный признак или нет.

 

 

Зная перечисленные вероятности,

легко реализовать процедуру

проверки наиболее вероятных признаков. Причем проверка очередного из них должна сопровождаться пересчетом значений всех апостериорных вероятностей. Для получения априорных и условных вероятностей необходимо обработать статистические данные (при их наличии) или получить и обработать экспертную информацию.

Выполнять расчет (иными словами делать вывод о значении вероятности существования той или иной гипотезы) можно и несколько мо-

дифицированным путем [15].

 

 

Пусть имеется набор признаков

 

Необходимо по набору

значений признаков определить наиболее

 

, , … , ;

вероятную гипотезу.

Эмпирическим путем можно определить следующие параметры:

 

– вероятность наличия j-го признака при отсутствии Hi (P).

 

априорная вероятность существования гипотезы

 

;

 

+

 

 

Si

 

 

i (P+);

( )

 

– вероятность наличия j-го признака в ситуации H

 

 

+

 

 

не независимы и не образуют полного

 

 

 

 

. Признаки

 

разбиения вероятностного пространства.

 

 

Функционирование системы, как и в первом случае,

состоит в по-

следовательной проверке наличия некоторых признаков и определения

Зная значения

априорных вероятностей

 

 

 

⁄ ≥ ( )

наиболее вероятной гипотезы или набора гипотез.

 

 

 

 

Признак

будет

подтверждать

гипотезу

 

, если

 

( )

.

 

P ) и (P ) можно для

6

гипотез и вероятностей наличия

признаков –

 

 

 

 

 

 

(

+

 

любой гипотезы подсчитать