Скачиваний:
31
Добавлен:
10.05.2014
Размер:
74.75 Кб
Скачать

Психологический, лингвистический и гносеологический аспекты извлечения знаний

Трудности, с к-рыми сталкивается инженер по знаниям: 1) неудачный способ извлечения знаний, не совпадающий со структурой знаний в данной области; 2) значительное упрощение "картины мира" экспертом; 3) неумение наладить контакт с экспертом; 4) терминологические проблемы; 5) отсутствие целостной системы знаний и неадекватная модель (язык) представления знаний; 6) неувязки организационного, финансового и др. характера.

Три аспекта извлечения знаний:

1. Психологический: рассматривается три слоя психологич. проблем, возникающих при извлеч. зн. (контактный, процедурный, когнитивный).

2. Лингвистический: рассматриваются слои важных для инженерии знаний проблем ("общего кода", понятийная структура, словарь пользователя).

3. Гносеологический: рассматриваются отдельные закономерности процессов отражения действительности в сознании человека (описание и обобщение фактов, установление связей, построение модели, объяснение и предсказание явлений).

Область экспертизы (действительность) (I 1) Модель мира эксперта  (I2)[Модель мира инженера по знаниям(I3)Поле знаний](I4)Модель знаний в СОЗ

67

Общая характеристика машины вывода, планировщика и подсистемы моделирования G2

М. вывода вып. рассужд. на осн.: знаний в БЗ; данных от подсист. моделир. и от внеш. источников. Правила возб-ся. маш. вывода. Если условия антецедента истинны, то сист-ма выполняет действия, наход. в консеквенте данного правила (присвоение значения простому атриб., парам или переменной; посылка управляющей инф. внеш. объекту; запуск процедуры; создание экземпляра объекта и т.д.). 9 сп. возбужд. правил: 1. Данные, вход. в условие правила, изменились; 2. Правило определяет значение переменной, котор. требуется другому правилу или процедуре; 3. возбуждается каждые n секунд (мех. процедур-демонов); 4. явное/неявное возбуждение другим правилом; 5. переменной, входящей в условие правила, присвоено значение независимо от того, изменилось оно или нет; 6. возбужд каждый раз при запуске приложения; 7. Определенный объект на экране перемещен пользователем или другим правилом; 8. определенное отношение между объектами установлено или уничтожено; 9. пер. не получила значения в рез-те обращ. к своему ист. данных.

Планировщик 1) контролирует всю активность, видимую пользователем, и активность фоновых задач; 2) определяет порядок обработки задач, взаимод. с источниками данных и пользователями, запускает процессы и осущ. коммуникацию с др. процессами в сети.

Подсист. моделирования внеш. окружения. – моделир. реальных объектов и устройств, с кот. работает ЭС. Основные возможности: 1. ср-ва для вычисления алгебраических, разностных и диф. (1пор.) уравнений. 2. возможность задания формул как для отдельных переменных, так и для классов переменны х или параметров. 3. возможность режима разделения времени, при кот. подсист моделир работала бы параллелно с ост подсист G2. Во вр разработки подсист моделирования исп вместо объектов реально мира для имитации показаний датчиков. Подсист моделир. играет роль самостоятельного агента знаний, повышая жизнеспособ. и надежн. приложений на базе G2.

69

Классификация ИС: Прикл. ИС: 1. Статические: 1) ИДС (акцент на ср-ва общения); 2) СОЗ(ЭС) (акц. на ср-ва вывода); 3) расчетно-логич. сист (на ср-ва планирования). 2. Динамические (функционируют в реальном времени): 1) ИЭС реального вр.; 2) распр. ИС различн. назнач.; 3) ИС поддержки принятия решений; 4) многоагентные сист.

Классификация СОЗ: 1. по ст. реализации: 1.1. прототипы: 1.1.1. Демонстр. (50-100 правил, 3 мес) 1.1.2. Исследоват. (200-500., 1-2 года) 1.1.3. Действующий (500-1000, 2-3) 1.2. Промышл. сист. (500-1500, 2-4) 1.3. Коммерч. сист. (1000-3000, 3-5). 2.по степени сложности: 2.1. Поверхностные («условие→действие») 2.2. Глубинные (более сложные модели предст. зн.) 3. по степени интеграции: 3.1. Традиционные (автономные) 3.2. Интегрированные 4. по сложности и типу ЭВМ: 4.1. простые (поверхностные СОЗ, традиционные СОЗ, выполняются на ПЭВМ, коммерч. стоимость 100-25к$, стоимость разраб. 50к-300к$, время разраб. 3-12 мес, кол-во правил 200-1000) 4.2. сложные(глубинные СОЗ, интегрированные СОЗ, вып. на символьных ЭВМ, рабочих станциях, мощных универс. ЭВМ, стоимость разраб. 5-10 млн $, время разраб. 1-5 лет, правил 200-1000).

Предметная областьспециальным образом выделенная и описанная область человеческой деятельности (мн-во сущностей, описывающих область экспертизы). ПрО – предм. + совокупность решаемых в ней задач.

Интеллект. с-ма – с-ма, ядром которой является база знаний, т.е. модель ПрО, описанная на языке сверхвысокого уровня, обычно приближенного к ЕЯ.Эти языки наз-ся ЯПЗ.

Неформализованные задачи (НФ-з.) – задачи, облад. 1 или неск. ил х-к: 1.Не могут быть вырадены в числовой форме.2.Не существует алгоритмического решения задач.3.Алгоритм.решение сущ., но его нельзя использовать из-за органиченности ресурсов (время, память и.т.п.)

СОЗ (ЭС) – сложный программный комплекс, аккумулирующий знания специалистов в конкретных проблемных/предметных областях.

Пользователь – лицо, для коорого предназначена с-ма.

Инженер по знаниям (когнитолог) – спец.в области ИИ, выступающий в роли связующего звена между источником знаний и ИнСист.

Эксперт – спец.,согласившийся поделиться своим опытом решения конкретного класса задач в конкретной ПрО.

База знаний – ядро ИнСист, т.е. совокупность знаний ПрО, записанная на мешинный носитель на ЯПЗ.

71

Основные характеристики машины вывода G2

М. вывода вып. рассужд. на осн.: знаний в БЗ; данных от подсист. моделир. и от внеш. источников.

Правила возбуждаются. машиной вывода. Если условия антецедента истинны, то сист-ма выполняет действия, наход. в консеквенте данного правила (присвоение значения простому атриб., парам или переменной; посылка управляющей инф. внеш. объекту; запуск процедуры; создание экземпляра объекта и т.д.).

9 способов возбуждения правил: 1. Данные, вход. в условие правила, изменились; 2. Правило определяет значение переменной, котор. требуется другому правилу или процедуре; 3. возбуждается каждые n секунд (мех. процедур-демонов); 4. явное/неявное возбуждение другим правилом; 5. переменной, входящей в условие правила, присвоено значение независимо от того, изменилось оно или нет; 6. возбужд каждый раз при запуске приложения; 7. Определенный объект на экране перемещен пользователем или другим правилом; 8. определенное отношение между объектами установлено или уничтожено; 9. пер. не получила значения в рез-те обращ. к своему ист. данных.

Методы 4-9 возбуждают правило при возникновении некоторого события. Для реализации этих методов в G2 введен спец. тип правил, начин. с ключ слова whenever (как только). Эти правила возбуждаются в первую очередь и облад наиб. приоритетом, что гарантирует своевременную реакцию сист-мы на изменения в окр. мире.

73

Инструментальный комплекс для создания статических СОЗ (ЭС) на примере комплекса АТ-ТЕХНОЛОГИЯ

1) ПрО выражается в объек­тах/атрибутах/отношениях межд. объектами; 2) все знания представляются с помощью продукций 3) недостоверные знания представлены в виде коэффициентов уверенности, неточных значений атрибу­тов, нечетких значений атрибутов и словаря функций принад­лежности. 4) описание правил, устанавливает зависимости между атрибутами объектов; 5) словарь функций принадлежности, представляет со­бой набор определений лингвистических переменных

базазнаний = {определение_типа} {определение_объекта} {определение_связи} {правило}[словарь_лингвистических_переменных]

определение_типа= определение_числового_типа | определение_символьного_типа|определение_нечеткого_типа

определение_объекта='ОБЪЕКТ' имя_объекта [ГРУППА* имя_группы] 'АТРИБУТЫ'список_атрибутов 'КОММЕНТАРИЙ' строка

определение_атрибута = 'АТРИБУТ' имя_атрибута 'ТИП' имя_типа 'КОММЕНТАРИЙ' строка

определение_связи = ('ДАННЫЕ'|'УПРАВЛЕНИЕ') 'ИМЯ СВЯЗИ' имя_связи

'ИСТОЧНИК' имя_объекта 'ПРИЕМНИК' имя_объекта 'КОММЕНТАРИЙ' строка

правило = 'ПРАВИЛО' имя_правила 'ЕСЛИ' логическое_выражение

'TO' {действие} ['ИНАЧЕ' {действие} ] 'КОММЕНТАРИЙ' строка

определение_числового_типа = 'ТИП' имя_типа ЧИСЛО'

'OT' минимальное__значение 'ДО' максимальное значение 'КОММЕНТАРИЙ' строка

75

Критерии выбора формализма для представления знаний

1. Если (понятия простые) И (отношения между ними на языке исчисл. предикатов), ТО логические модели

2. Если (понятия в основном простые) И (небольшое число отнош.) И (способ рассуждений индуктивный), ТО индуктивная модель

3.Если(понятия устроены сложно) И (большое число отношений на пон.) И (способ рассуждения – выдвижение гипотез), ТО сетевые модели.

4.Если(понятия устроены сложно) И (небольшое число отношений) И(дедуктивный), ТО наследственно-конечные модели

5. Если(понятия устроены сложно) И (большое число отношений) И (по аналогии или дедуктивный), ТО фреймовые модели

6. Если (понятия простые)И(большое число отношений)И(дедуктивный)ТО продукц. модели

7. Если(понятия устроены сложно) И (структура понятий не ясна)И(выдвижение гипотез), ТО сетевые модели

8. Если(понятия устроены сложно) И (большое число отнош.)И (индуктивный), ТО подходящего формализма нет

9. Если (знания поверхност) И (жесткие), то логич. модель

10. Если (знания поверхност) И (мягкие/жесткие), то продукционные модели

11. Если (знания глубинные) И (мягкие/жесткие), то семантич. сети или фреймы

77

Промышленная технология создания СОЗ (ЭС)

1.фаза проектирования. 1.1.инициализация проекта СОЗ. 1.2.формирование группы разработки,

1.3.опред треб к сист. 1.4.проведение исследований по выполнимости проекта. 1.5.разраб общей концепции сист-мы.

2.фаза разработки (по методу прототипирования). Нач стадия (разраб 1-ого прототипа на основе концепции, выбр на фазе1), промежут стадия (создание на базе 1-го прототипа серии прототипов с последовательно улучш хар-ми), финальная стадия (разраб сист-ма, служащая основой для перевода в головной образец).

2.1.общие соображения по прототипированию, 2.1.1.вбор доста широты и глубины проработки задачи для данного прототипа. 2.1.2.привлечение конечных польз к работе над прототипом, 2.1.3.организация эффективного взаимод в группе разработки, 2.1.4.проведение оценки функционирования очередного прототипа,

2.2.виды стратегий прототипирования, 2.2.1.создание начального прототипа для всей задачи в целом, его тестирование и отладка сист-мы на серии послед прототипов. 2.2.2.создание прототипа, облад на поверхн уровне всеми функциональными возможностями для всех подзадач, его тестирование. 2.2.3.создание прототипов для каждой подзадачи, поочередное тестирование каждого из прототипов, затем их объединение.

2.3.документирование разраб.

2.4.прототипирование с исп 1-й стратегии (по аналогии с исп 2-й и 3-й стратегии).

3.фаза внедрения.

3.1.создание на базе финального прототипа головного образца, опирающегося на реальную раб среду,

3.2.перенос сит-мы из среду разработки в среду функционирования у заказчика.

79

Фреймы в СОЗ (ЭС)

Фрейм. F=<N, a1b1[P1], a2b2[P2], … aNbN[PN] >, где N – имя фрейма, ai – имя слота, – bi значение слота, [Pi] – привязанная к слоту процедура (опционально).

Фреймы-прототипы хранятся в БЗ, фреймы-экземпляры – создаются для отобр. конкр. ситуаций на основе поступающих данных. Легко организуются в однородные (без учета имен слотов при отсылке к др. фреймам) и неоднородные.

FRL (frame representation language).

<фрейм> ::= (<имя фрейма> {<слот>});

<фрейм> ::= (<имя фрейма> <тело фрейма>);

<тело фрейма> ::= {<слот>};

<слот> ::= (<имя слота> (<тип слота> <тело слота>));

<тело слота> ::= {<данные>};

<данные> ::= <накопитель данных>{<комментарии>}; <комментарии> ::= <места>{<сообщение>}; <сообщение> ::= <литерал>;

<имя фрема> ::= <идентификатор>; <имя слота> ::= <идентификатор>;

<тип слота> ::= <идентификатор>; <метка> ::= <идентификатор>;

<накопитель данных> ::= <конкретное данное> | <имя фрейма> | {<вызов процелуры>}; <конкретоне данное> ::= <число> | <текст>;

<тип слота> ::= <декларативный> | <наследование> | <процедурный>;

<декларативный> ::= <value> | <default>;

<наследование> ::= <AKO> | <instance>;

<процедуральный> ::= <require> | <if needed> | <if added> | <if removed> | <prefer>

81

Обзор ЯПЗ комплекса АТ-технология

<файл .kbs> Внутреннее представление знаний в РП основывается на сращивании продукционной модели и объектно-ориент.подхода. Сущности ПрО отображаются в иерархию классов, а закономерности – в инкапсулированные правила. Для описания знаний с неопределенностью введены 2 коэфф.: уверенность и возможность, приписываемые утверждениям, входящим в посылки и следствия правил, отображающих закономерности в ПрО; интервал [0..100] Аналогично обрабатывается неточность, только 0 – абсолютно точное число. база_знаний= {определение типа} {определение_объекта} {опр.связи} {правило} {словарь_ лингвистичес-ких_ переменных}

<здесь символы ; означают перенос строки, в ЯПЗ их нет! для краткости просто>

ЯПЗ позволяет определять 3 типа- числовой, символьный, нечеткий.Например: ТИП тип1; ЧИСЛО; ОТ 0 ДО 1024;КОММЕНТАРИЙ кол-во компьютеров.

Объекты описывают сущности ПрО.Атрибуты об. – х-ки сущностей, связи – отношения между объектами. определение_объекта = ‘ОБЪЕКТ’ имя_объекта; ‘АТРИБУТЫ’ список_атрибутов . определение_атрибута = ‘АТРИБУТ’ имя_атрибута; ‘ТИП’ имя_типа. Унарные и бинарные отношения между объектами описываются связями 2 видов – по данным и по управлению. Пример: определение_связи = ‘ИМЯ_СВЯЗИ’ имя_связи; (‘ДАННЫЕ’| ’УПРАВЛЕНИЕ’);’ИСТОЧНИК’ имя_источника; ‘ПРИЕМНИК’ имя_приемника.

Описание правил. Синтаксис: ‘ПРАВИЛО’ имя_правила; ‘ЕСЛИ’ логическое_выражение; ‘ТО’ {действие}; {‘ИНАЧЕ’{действие}} .

Логическое выражение описывается в инфиксной (оператор между операндами) форме, с помощью операторов &, |, ~ и скобок, и состоит из утверждений об атрибутах и отношениях между объектами.

Словарь лингвистических переменных – не является обязательной секцией БЗ. Синтаксис задания:

словарь_лингвистических_переменных = ‘СЛОВАРЬ’; число_статей; {определение лингв.переменн}

Например, СЛОВАРЬ; “Скорость”; 3; “Малая”; “Средняя”; “Большая”

83

История ИИ (кратко), структура ранних СИИ

50-е годы, нейроподобные структуры, нейрокомпьютинг, нейроинформатика.

60-е годы, (эвристика), шахматные программы (КАИССА), программы решения интеллектуальных задач, музыкальные программы, написание волшебных сказок.

70-е годы, (лингвистика), обработка символьной информации, система «ПОЭТ», общение с ЭВМ на естественном языке (неформализованном, без правил), модели, методы обработки языков.

конец 70-х – начало 80-х годов, инженерия знаний, извлечение, структурирование, формализация, манипуляция, вывод на знаниях, объяснение на знаниях.

начало 80-х годов, Интеллектуальное программирование: (LISP) (языки представления знаний, трансляторы – инструментарий среды, автоматический синтез программ.

середина 80-х, Прикладные ИС (статические, динамические): ИДС, ЭС(СОЗ), ИСАПР.

90-е годы, интегрируемые системы реального времени, интегрирование интегрируемых систем.

Блок-схема ранней СИИ

Запрос на ЕЯПреобраз. 1(во внутр. представл.)Блок предст.зн.Преобраз.2(из внутр. представл.)Ответ на ЕЯ (возм., на др. яз)

Блок представления знаний<->со всеми из перечисленных:

Блок интерпретации знаний<->Блок усвоения знаний<->Интеллектуальный банк данных (База целейБаза знанийБаза данных)<->Блок вывода (формирования) решений

85

Соседние файлы в папке Интеллектуальные диалоговые системы