Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
глава 4 все.doc
Скачиваний:
21
Добавлен:
05.12.2018
Размер:
3.56 Mб
Скачать

I). Приобретение знаний на метауровне

Методы категории А можно назвать обучением без выводов или механическим запоминанием. Здесь полученная информа­ция используется для решения задач в том же виде, в котором по­ступает в систему.

В методах категории В внешняя информация поступает в компьютерную систему в форме знаний, следовательно, ее мож­но использовать в процессе логического вывода. Примером та­кой информации являются правила, поступающие в ЭС продук­ционного типа. В интеллектуальной системе необходимо иметь функцию преобразования поступающих знаний в формат, удоб­ный для дальнейшего использования. Эту функцию выполняют редакторы знаний, которые, в отличие от редакторов данных в БД, не только корректируют поступающую информацию, но и выполняют проверку знаний, содержащихся в БЗ, на наличие конфликтов (противоречий) с новыми знаниями.

Если знания поступают в ИИС во внешнем формате, то кроме преобразования и редактирования возникает задача их понимания. Такие проблемы характерны для систем с ЕЯ-интер­фейсом.

Одной из актуальных проблем ИИ является операционализация знаний, связанная с пониманием, преобразованием и исполь­зованием советов и подсказок, которые человек сообщает интел­лектуальной системе в ходе решения конкретных задач. Советы и подсказки, поступающие в систему на естественном языке в терминах предметной области, необходимо преобразовывать в процедуры, ориентированные на выполнение определенных действий.

Категория С принципиально отличается от А и B тем, что ин­теллектуальные системы приобретают знания самостоятельно, выполняя сбор отдельных фактов, их обобщение и систематиза­цию. В процессе решения задач определенного класса (приме­ров) компьютерная система выявляет понятия, выбирает формат их представления и проводит структуризацию. Подобные задачи вызывают сложности и у человека (см. разд. 4.1, 4.2).

Проблемы понимания и преобразования знаний характерны для категорий В и С, причем последняя отличается наличием процедур обобщения, примерами которых являются замена по­стоянных атрибутов языка (констант) на переменные, исключе­ние описаний с ограниченным применением, индукция, абдук­ция и др. Способы обобщения тесно связаны с языком представ­ления знаний в ИИС.

Параметрическое обучение — самая простая форма в категории С. Оно заключается в определении общего вида правила, формирующего результат вывода, и в последующей корректировке вхо­дящих в него параметров, зависящих от конкретных данных. Пример обучающейся системы такого типа — известная эксперт­ная система Meta-Dendral, предназначенная для построения структурных формул химических соединений на основе данных масс-спектрального анализа [37, 50]. В ней выводятся новые пра­вила путем коррекции уже заложенных в БЗ продукций.

Обучение по аналогии базируется на гипотезе о том, что «если две ситуации подобны по нескольким признакам, то они подоб­ны еще по одному признаку». Подобие ситуаций распознается на основе обобщенной меры совпадения значений важнейших при­знаков, с помощью которых описаны ситуации.

Вопросы индуктивного обучения рассматриваются в разд. 4.3.1, а моделям нейронных сетей посвящена глава 5.

Вопросы приобретения знаний на метауровне актуальны на со­временном этапе развития ИИ, так как связаны с выработкой стратегий управления процессом решения задач в ИИС. Это на­правление активно развивается, но здесь пока не выработано ус­тойчивых представлений и апробированных моделей. Вопросы приобретения метазнаний частично затрагиваются в новых на­правлениях Data Mining и Knowledge Discovery, которые связаны с извлечением знаний из данных и будут рассмотрены ниже.

4.3.1.

ИНДУКТИВНЫЕ ВЫВОДЫ В ЛОГИКЕ

Выводы по индукции позволяют на основе обобщения част­ных фактов получить общие (для некоторого множества объек­тов) закономерности. В процессе индуктивного обучения форми­руются новые правила, теории и структуры. Индуктивные выво­ды возможны в том случае, когда представление результата час­тично определяется на основе входной информации. В дедуктив­ных выводах (см. главу 2) диапазон порождаемых представлений не может быть шире диапазона, заданного априори. Диапазон представлений, порождаемых в процессе индуктивного вывода, шире, чем диапазон, заданный изначально.

Пусть Р — множество известных фактов, имеющихся в БЗ, а H некоторая гипотеза (направленная на обобщение этих фактов). Если Р выводится из Н, то будем считать гипотезу H истинной. Это можно записать в виде

Рассмотрим пример. Пусть множество Р включает факты:

Р = {ДОМ(иванов), ДОМ (петров), ДОМ (сидоров)}.

Предикат ДОМ(Х) имеет интерпретацию «Объект X имеет дом». На основе заданного множества фактов Р выдвигаем гипо­тезу Н:( Х)ДОМ(Х), которая соответствует обобщению следую­щего вида: «Любой объект X имеет дом». Гипотеза H является ис­тинной для любого факта из множества Р, следовательно, Р выво­димо из H, и мы вправе считать гипотезу H истинной. Замена констант «иванов», «петров» и «сидоров» обобщающей перемен­ной (Х) расширяет область действия предиката ДОМ(Х) за пре­делы множества Р. Например, при появлении нового объекта «березкин» можно получить вывод ДОМ(березкин), хотя из Р это­го не следует. Следовательно, диапазон объектов расширился по сравнению с исходным, а гипотеза H может быть помещена в БЗ как новый элемент знаний. За счет расширения множества P по­является возможность вывести новые заключения, которые так­же можно включить в БЗ. Однако при расширении класса объек­тов всегда есть возможность совершить ошибку. Например, если в рассмотренном примере появляется объект «береза», то приходим к странному выводу — ДОМ(береза). Очевидно, обоб­щение H является слишком широким в данном случае. Попыта­емся сузить его, ограничив количество объектов. Пусть что можно интерпретировать фразой

«гипотеза H истинна, если подмножество Р2 множества Р можно вывести из гипотезы H и оставшегося подмножества Р1».

Допустим, подмножества Р1 и Р2 имеют вид:

Р1{X[ДОМ(X)→ЧЕЛОВЕК(X)]};

P2={ДОМ(иванов); ДОМ (петров); ДОМ (сидоров)}.

На основании нового множества Р можно выдвинуть другую гипотезу

Нi:( Х)[ЧЕЛОВЕК(Х)→ДОМ(Х)], которая накладывает ограничение на область подстановки объектов в переменную X, так как в данном случае этот объект должен быть человеком. Теперь при появлении объекта «березкин» можно вывести факт ДОМ(березкин), но при появлении объекта «береза» значением предиката ЧЕЛОВЕК(береза) будет «ложь» и, следовательно, факт ДОМ(береза) не будет выведен.

Если в множество Р добавить информацию о существовании людей, не имеющих дома, т.е. в множество Р1, добавить формулу

(Х)[ЧЕЛОВЕК(Х)^¬ДОМ(Х)],

то при подстановке объекта «березкин» не сможем вывести предикат, ДОМ(березкин), так как принадлежность к роду челове­ческому в данном случае не является достаточным условием для владения недвижимостью. Следовательно, диапазон объектов подстановки необходимо сделать еще уже. Модифицируем под­множество Р1, добавив еще одно условие:

(X)[ДОМ(Х) →ВЛАДЕЛЕЦ(Х)]}.

Выдвинем новую гипотезу H2:

(X)[ ВЛАДЕЛЕЦ(Х) → ДОМ(Х)]}.

Теперь будем получать правдоподобные выводы, так как мно­жество объектов для возможных подстановок в приведенные формулы ограничено людьми — владельцами домов.

Традиционный метод обобщения состоит в выборе гипотезы минимального обобщения среди большого числа возможных гипо­тез, в которых объекты из заданного множества фактов 2) заме­няются переменной и которые расширяют диапазон применения исходных логических формул. Гипотеза Н2 в рассмотренном при­мере называется минимальным обобщением. Для того чтобы формализовать процесс минимального обобщения, необходимо иметь правила, с помощью которых можно выбрать ту или иную гипотезу. Например, чтобы увидеть, какое из ограничений силь­нее ЧЕЛОВЕК(Х) или ВЛАДЕЛЕЦ(Х), необходимо иметь правило вида

(Х)[ВЛАДЕЛЕЦ(Х)ЧЕЛОВЕК(Х)].

Если такие правила сформулированы в системе, то процесс замены констант на переменные не представляет особых трудно­стей. Удаление из БЗ фактов, противоречащих установленным правилам, обычно не вызывает осложнений. Трудной проблемой является создание новых предикатов, поскольку эта операция неформализуема.

Таким образом, индуктивный вывод — это построение объясня­ющего правила на основе заданных данных. В системах с индуктив­ными выводами на каждом шаге необходимо объяснять все данные, полученные к заданному моменту времени. Данные, полученные на последующих шагах, могут не удовлетворять ранее полученным объяснениям. В этом случае следует корректировать полученные ранее объясняющие правила (гипотезы). Следовательно, процесс индуктивного обучения может оказаться весьма длительным, что вполне согласуется с процессом обучения человека.

Для реализации индуктивного вывода необходимо:

  • сформулировать множество правил — объектов вывода;

  • выбрать формальный метод представления правил;

• определить способ получения информации извне (показ примеров);

• задать формальный метод вывода;

• сформулировать критерий правильности вывода.

Индуктивные выводы выполняются в процессе бесконечного повторения цикла, включающего процедуры запроса входных данных, формирования гипотез, получения и проверки результа­тов. В настоящее время индуктивные выводы часто используют­ся для порождения объясняющих гипотез в системах с правдопо­добными рассуждениями абдуктивного типа, в которых могут быть построены различные обобщения базовой теории, соответ­ствующие наблюдаемым фактам.

4.3.2.

ДСМ-МЕТОД

Сокращение ДСМ расшифровывается Джон Стюарт Милль. Этот ученый в середине XIX в. предложил принципы индуктив­ного вывода, которые положены в основу метода автоматическо­го порождения гипотез. Способы установления причинно-след­ственных отношений, предложенные Миллем, основываются на идеях выявления сходства и различия в наблюдаемых ситуациях. Способность улавливать сходство и выделять различия — фундаментальная способность, присущая, по-видимому, всем живым существам. Опираясь на эту способность, Милль сформулировал следующие принципы индукции.

1. Принцип единственного различия: «Если после введения ка­кого-либо фактора появляется (или после его удаления исчезает) известное явление, причем мы не вводим и не удаляем никакого другого обстоятельства, которое могло бы иметь влияние, то ука­занный фактор составляет причину явления» [34]. Этот принцип можно проиллюстрировать схемой:

А, В, C=> D

А, В, С => D

………..

A, В, C=> D

B, С не => D

Знак => трактуется как появление D при наличии А, В, С. При достаточном количестве экспериментов принцип единственного различия позволяет утверждать, что А является причиной, a Dследствием.

2. Принцип единственного сходства, который гласит: «Если все обстоятельства явления, кроме одного, могут отсутствовать, не уничтожая этим явления, то это обстоятельство является причи­ной данного явления». Схема такова:

A, В, C=> D

A, В, C=> D

………

A, В => D

A, C=> D

………

A => D

Из этой схемы следует, что А и D связаны причинно-следст­венным отношением.

3. Принцип единственного остатка: «Если вычесть из како­го-либо явления ту его часть, которая является следствием изве­стных причин, то остаток явления есть следствие остальных при­чин». Рассмотрим схему:

A, В, C=> D, E

A, В, C=> D, E

………

В, C=> E

После того как из примеров A, В, C=> D было «вычтено» причинно-следственное отношение A=>D, были получены на­блюдения В, С => Е, на основании которых можно предположить, что В и С являются возможными причинами явления Е. Для даль­нейшего уточнения нужно проверить, приводит ли исключение В к появлению Е. Если так, то причиной явления Е служит С, в про­тивном случае — В. Возможно также, что явление Е обусловлено одновременным наличием В и С, т.е. появление некоторого эле­мента ситуации может определяться не отдельными факторами, а их совокупностью.

Схемы Милля справедливы лишь при условии, что в описа­нии ситуации присутствует полное множество наблюдаемых фак­тов и явлений.

Сущность ДСМ-метода заключается в следующем. Пусть за­дано множество причин А = {А1, А2,..., Ар), множество следствий В = {В1, В2,..., Вт) и множество оценок Q = { q1, q2,..., gr}. Выраже­ние вида Ai=>Bj называется положительной гипотезой, выражаю­щей утверждение «Аi является причиной Bj с оценкой достовер­ности qk». Отрицательной гипотезой называется выражение Ai не=>Bj, которое формулируется «Аi не является причиной Bj с оценкой достоверности qk». Положительные гипотезы будем обо­значать h+i,j,k, отрицательные — h-i,j,k. Среди значений выделим два специальных, которые можно интерпретировать как «ложь» (0) и «истина» (1). Гипотезы с этими оценками можно рассматривать как явления, истинность или ложность которых твердо установ­лена. Остальные значения между 0 и 1 будем обозначать рацио­нальными числами к/п, где к=1,..., п-1, а п характеризует число примеров.

Обобщенный алгоритм ДСМ-метода включает следующие шаги.

1. На основе исходного множества положительных и отрица­тельных примеров (наблюдений) формируется набор гипотез, ко­торые записываются в матрицы М+ и М-. Гипотезы формируют­ся на основе выявления сходства и различия в примерах. Матри­цы имеют вид:

2. К исходному множеству примеров добавляются новые на­блюдения, которые могут либо подтверждать выдвинутые гипо­тезы, либо опровергать их, при этом оценки гипотез изменяются следующим образом. Если некоторая гипотеза hijk имела оценку qk=k/n, то при появлении нового примера (n+1) проводится про­верка на подтверждение этой гипотезы. В случае положительно­го ответа оценка qk=(k+l)/(n+l), иначе qk=(k-1)/(n+1). В процес­се накопления информации оценки выдвинутых гипотез могут приближаться к 1 или 0. Изменение оценок может также иметь колебательный характер, что, как правило, ведет к исключению таких гипотез из множеств М + или М-.

  1. Циклическое добавление примеров, сопровождающееся изменением оценок достоверности гипотез с периодическим из­менением множеств М + и М-.

  2. Завершение процесса индуктивного вывода при выполне­нии условий окончания цикла. В качестве таких условий могут использоваться меры близости значений qi к 0 или 1, а также до­полнительные условия, которые могут быть связаны с ограниче­нием времени (количества новых примеров) вывода и т.п.

В современных модификациях ДСМ-метода используются выводы по аналогии, проводится учет контекста реализации при­чинно-следственных отношений, применяются нечеткие описа­ния фактов и т.д. [3, 29, 43].

4.4.

СРЕДСТВА КОМПЬЮТЕРНОЙ ПОДДЕРЖКИ

ПРИОБРЕТЕНИЯ ЗНАНИЙ

Проблема автоматизированного приобретения знаний связа­на с разработкой специальных информационных технологий, обеспечивающих поддержку процедур извлечения и структуриро­вания знаний. К настоящему времени автоматизированные сис­темы приобретения знаний прошли в своем развитии три стадии.

На первой стадии в середине 1980-х гг. появилось первое по­коление систем приобретения знаний на базе «оболочек» экс­пертных систем. Процессы извлечения и структурирования зна­ний выполнялись человеком. Подсистема приобретения знаний служила для ввода знаний в БЗ и ее корректировки. Экспертные системы заполнялись знаниями по следующей схеме:

  • создание конкретной экспертной системы;

  • опустошение базы знаний;

  • разработка системы приобретения знаний для нового на­полнения БЗ;

  • формирование базы знаний для другой экспертной системы.

На второй стадии в конце 1980-х гг. появились системы при­обретения знаний второго поколения, основанные на предвари­тельном детальном анализе предметной области и моделях, поз­воляющих рассматривать процедуры извлечения, структурирова­ния и формализации знаний как процесс преобразования линг­вистических знаний в другие представления и структуры [11]. Су­щественное влияние на системы второго поколения оказала пси­хосемантика, на базе которой были созданы инструментальные средства многомерного шкалирования, факторного анализа, ре­пертуарных решеток, логического

Третья стадия развития систем приобретения знаний (с 1990-х гг.) связана с созданием автоматизированных средств приобретения знаний. При этом структура БЗ формируется в процессе приобретения знаний, а не заранее.

Множество существующих и потенциально возможных сис­тем приобретения знаний можно отобразить классификацией, предложенной в работе [11] (табл. 4.6).

Таблица 4.6

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]