Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

24-11-2013_21-35-40 / Тема 7_Базы знаний

.pdf
Скачиваний:
59
Добавлен:
20.05.2015
Размер:
182.59 Кб
Скачать

Тема 7 Базы знаний. Определения и свойства баз знаний.

1.Понятие базы знаний

2.Когнитивное моделирование. Технологии проектирования баз знаний.

3.Этапы проектирования баз знаний

4.Методы проектирования баз знаний

5.Базы знаний и системы управления знаниями организации.

1. Понятие базы знаний

База знаний - семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем

Система, основанная на знаниях - система искусственного интеллекта, в которой предметные знания представлены в явном виде и отделены от прочих знаний системы

Искусственный интеллект - способность прикладного процесса обнаруживать свойства, ассоциируемые с разумным поведением человека.

Искусственный интеллект - раздел информатики, занимающийся вопросами имитации мышления человека с помощью компьютера.

Механизм вывода - в системах искусственного интеллекта - процедура нахождения решений задач. Принципы построения механизма вывода определяются способом представления знаний и видом моделируемых рассуждений.

При изучении интеллектуальных систем традиционно возникает вопрос — что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным.

Данные — это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

При обработке на ЭВМ данные трансформируются, условно проходя следующие

этапы:

D1 — данные как результат измерений и наблюдений;

D2 — данные на материальных носителях информации (таблицы, протоколы, справочники);

D3 — модели (структуры) данных в виде диаграмм, графиков, функций; D4 — данные в компьютере на языке описания данных;

D5 — базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания — это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи а этой области.

При обработке на ЭВМ знания трансформируются аналогично данным. Z1 — знания в памяти человека как результат мышления;

Z2 — материальные носители знаний (учебники, методические пособия);

Z3 — поле знаний — условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;

Z4 — знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы — см. далее);

Z5 — база знаний на машинных носителях-нформации.

1

Часто используется такое определение знаний.

Знания — это хорошо структурированные данные, или данные о данных, или метаданные.

Знания делятся на четыре вида: понятийные, конструктивные, процедурные

ифактографические.

1)Понятийные или концептуальные знания - это набор понятий из некоторой области знания, их свойства и взаимосвязи.

2)Конструктивные знания — знания о структуре объектов, о взаимодействии их

частей.

3)Процедурные или алгоритмические знания - это уже известные людям методы решения задач, алгоритмы, программы.

4)Фактуальные или фактографические знания - это количественные и качественные характеристики конкретных объектов.

Например, если в качестве объекта взять обычный письменный стол, то знания о нем можно распределить следующим образом:

Понятийное знание: стол предназначен для того, чтобы на нем писать; он изготовлен из некоторого материала, имеет вес, длину, ширину, высоту, цвет и пр.

Конструктивное знание: стол имеет столешницу, четыре ножки, два ящика. Столешница расположена сверху, горизонтально. Ножки расположены под столешницей по углам, на некотором расстоянии от края столешницы с небольшим наклоном внутрь стола. Ящики расположены справа под столешницей друг под другом. Ножки закреплены на болтах; ящики — тоже. Ящики снабжены ручками и замками. И т. д.

Фактуальное знание: стол изготовлен из дерева, болты — стальные; высота стола

— 70 см, длина — 110 см, ширина — 60 см, цвет — коричневый и пр.

Алгоритмическое знание — это правила сборки стола из составных частей (правила установки ножек и ящиков), правила крепления деталей с помощью болтов, правила установки замков на ящиках, правила запирания/отпирания замков и пр.

Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний

— базы знаний (небольшого объема, но исключительно дорогие информационные массивы).

База знаний — основа любой интеллектуальной системы.

База знаний — это особого рода база данных, разработанная для оперирования знаниями (метаданными). Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.

Современные базы знаний обычно работают совместно с продвинутыми системами поиска информации и имеют тщательно продуманную структуру и формат представления знаний.

Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.

Любая база знаний (БЗ) содержит в себе базу данных (БД) в качестве составляющей, но не сводится к ней. Главное отличие БЗ от БД с точки зрения пользователя — ее активность. База данных — пассивна. Из базы данных можно извлечь лишь ту фактическую информацию, которая в нее заложена. База знаний — активна. Благодаря процедурной компоненте она может сама выводить новые факты, которые непосредственно в нее заложены не были, может по своей инициативе вступать во взаимодействие с другими установленными на компьютере системами и с человеком.

2

При построении баз знаний традиционные средства, основанные на численном представлении данных, являются неэффективными. Для этого используются специальные языки представления знаний, основанные на символьном представлении данных. Они делятся на типы по формальным моделям представления знаний. Один из самых интересных вопросов при работе со знаниями — это вопрос о средствах представления знаний.

Необходимо различать три уровня представления:

внешнее представление - знания в том виде, в котором их видит пользователь (при вводе информации в систему и при получении информации из системы),

внутреннее представление - знания в том виде, в котором они хранятся в системе,

смысловое (модельное) представление - знания в том виде, в каком пользователь может их себе представлять при работе с системой.

Например, пусть требуется представить информацию о дорогах между населенными пунктами района. Представлять себе ее удобней всего в виде графа, вершинами которого являются населенные пункты, а ребрами (или дугами) - дороги. Это

ибудет модельное представление знаний. Однако ввод его в ЭВМ в таком виде может быть затруднен. Разные уровни представления могут и совпадать.

Существует несколько возможных модельных представлений знаний - продукционные и логические модели; представление знаний в виде графов, фреймов и т. д. Многие варианты представлений знаний в виде графов имеют свои собственные названия: семантические сети, ассоциативные сети, вычислительные модели, модели «сущность-связь», бинарные модели и др.

2.Когнитивное моделирование. Технологии проектирования баз знаний.

Кконцу 90-х годов созрели предпосылки для качественного скачка в интенсификации познавательного использования компьютерных технологий: компьютер реально стал не только и не столько вычислительным устройством (как это, собственно, и должно было следовать из его названия), и не столько просто устройством для хранения и обработки больших объемов информации, сколько комплексным познавательным инструментом - массовым атрибутом современного образовательного процесса и научных исследований.

В связи с этим особую актуальность приобретают исследования в области изучения

ианализа именно познавательных (правомерно использование и более специфического термина: когнитивных) функций компьютерных технологий. Основная цель таких исследований заключается в более глубоком понимании и, как следствие, в существенно более эффективном использовании когнитивных возможностей современного компьютера.

Интерактивная машинная графика (ИМГ) стала уже практически обязательным атрибутом всех современных систем моделирования. Следующим шагом в данном направлении должно стать всестороннее, комплексное и целенаправленное использование ИМГ для максимальной активизации творческого и познавательного потенциала человеческого интеллекта.

Важнейшим атрибутом когнитивного компьютерного моделирования являются когнитограммы, т.е. специальным образом организованная визуализация моделей, данных и результатов моделирования, ориентированная на максимальную активизацию образно-интуитивных механизмов мышления. Можно выделить три категории когнитограмм: искусственные (абстрактные), естественные (в той или иной степени имитирующие реальную или виртуальную визуальную обстановку) и комбинированные или совмещенные, объединяющие свойства первых двух категорий.

3

Самыми распространенными в настоящее время являются искусственные когнитограммы, наиболее простым вариантом реализации которых можно считать использование традиционной визуализации результатов в виде разнообразных графиков и диаграмм различной размерности.

Еще одним видом когнитограмм данного класса являются так называемые когнитивные карты, отображающие в виде специальных структурных схем концептуальные и логические зависимости различных когнитивных моделей.

3. Этапы проектирования баз знаний

Многие созданные к настоящему времени ЭС ориентированы на решение конкретных задач и сконструированы с использованием разнообразных инструментальных средств. Однако к настоящему времени выделены основные принципы их построения.

Каждая конкретная ЭС является человеко-машинной системой. В ее разработке необходимо участие экспертов, инженеров по знаниям и консультантов.

Эксперты – это специалисты в данной ПО, знания которых требуются ввести в база знаний ЭС, чтобы в дальнейшим система смогла их использовать при выполнении своих не посредственных функций.

Эксперт – профессионал обладает знаниями двух типов – вербализуемые и невербализуемые Вербализуемые знания выражаются словесно или письменно, с использованием различных графиков, схем, обобщаются в виде статей, монографий, научных отчетов.

Невербализуемые знания отражают тот профессиональный опыт специалиста, который он накопил в процессе своей профессиональной деятельности который желают его эксперты. Зачастую эти знания представляют наибольший интерес для проектируемой ЭС. Однако они являются невербализуемыми, т.е. трудновыразимыми, так как существует у специалиста подсознательно. Получение таких знаний и является в настоящее время одной из центральных задач для специалистов искусственному интеллекту. Разрабатываются специальные психологические методы и примеры косвенного выявления таких знаний.

Конструкторы – группа специалистов в области АС обработки данных, поддерживающий инструментальный пакет программ, и других технологических средств, на базе которых создаются ЭС.

4.Методы проектирования баз знаний

Внастоящее время основным узким местом при проектировании баз знаний ЭС является приобретение необходимых знаний для ЭС. Знания о ПО можно взять из разных источников (научные отчеты, монографии, статьи, БД, опытные данные и т.п., а также личный опыт эксперта проффесионала). Работа по сбору и обработке знаний выполняется специалистом инженером по знаниям. Обычно большую часть профессиональных знаний инженер по знания получает от эксперта. К настоящему времени уже сформировался ряд методов проектирования баз знаний, ориентированных на получение информации от экспертов. Рассмотрим их.

Беседы с экспертом. В данной группе методов различают наблюдательный и интуитивный подходы.

При наблюдательном подходе следят за работой эксперта, стараясь не сделать что могло бы повлиять на работу эксперта при решении задачи. За наблюдение следует этап уточнения, на котором инженер по знаниям совместно с экспертом анализирует запись сеанса работы эксперта, выполненную наблюдателем. Такой подход еще называют анализом протоколов.

При интуитивном подходе в одном случае эксперт выступает как разработчик модели своего проведения при решении задач, во втором как инженер познаниям изучает

4

литературу и другие источники информации, разрабатывает представление знаний о ПО и затем проверяет их достоверность с экспертами.

Обсуждение задач. Инженер по знаниям подготавливает некоторый набор задач и затем в свободной обстановке обсуждает их с экспертом, стараясь определить как, организованы знания эксперта об этих задачах какими понятиями и гипотезами по По он руководствуется в своей работе, как работает с неполными, неточными либо противоречивыми данными по той или иной задаче.

Описание задачи. Эксперт подготавливает описание типичных задач ПО. Этот метод очень хорошо работает на задачах диагностического типа.

Анализ задач. Инженер по знаниям подготавливает несколько задач, близких к реальным и просит эксперта решить их. Цель того – выявить стратегию, используемою при решении задачи. Рассуждая в слух, работающие стремятся выделить как можно больше промежуточных шагов решения и проанализировать их.

Оценивание системы. Эксперт анализирует и критически оценивает правила вводимые в базу знаний ЭС, анализирует стратегии выбора правил системой при решении задач рассматривает обоснованность их применения, постоянно сравнивая их со своими методами решении задач.

Проверка системы. Инженер по знаниям представляет задачи и результаты их решения, выполненные как экспертом, так и прототипом создаваемой системы другим экспертом. Цель – выявление элементов, вызывающих разногласия.

Кроме выше названых, существует еще целый ряд практических методов, используемых при проектировании базы знаний на каждом этапе.

Полученные от экспертов и из других источников знания необходимо зафиксировать в виде концептуальной базы знаний первого варианта системы. Для этого выполняется следующая спецификация выявленных знаний.

5. Базы знаний и системы управления знаниями организации.

Понятие «управление знаниями» (КМ — Knowledge Management) появилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту и стали критическими. При этом стало очевидным, что основным узким местом является обработка знаний, накопленных специалистами компании, так как именно знания обеспечивают преимущество перед конкурентами. Часто информации в компаниях накоплено даже больше, чем они в состоянии обработать. Различные компании пытаются решать этот вопрос по-разному, но при этом каждая компания стремится увеличить эффективность обработки знаний.

Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, включают руководства, письма, новости, информацию о заказчиках, сведения о конкурентах и данные, накопившиеся в процессе разработки. Для применения КМ-систем используются разнообразные технологии:

электронная почта;

базы и хранилища данных (Data Wharehouse); системы групповой поддержки; броузеры и системы поиска; корпоративные сети и Интернет;

экспертные системы и базы знаний; интеллектуальные системы.

Традиционно проектировщики систем КМ ориентировались лишь на отдельные группы потребителей — главным образом менеджеров. Более современные КМ-системы спроектированы уже в расчете на целую организацию.

Хранилища данных, которые работают по принципу центрального склада, были одним из первых инструментариев КМ. Как правило, хранилища содержат многолетние версии обычной БД, физически размещаемые в той же самой базе. Когда все данные

5

содержатся в едином хранилище, изучение связей между отдельными элементами может быть более плодотворным.

При этом активы знаний могут находиться в различных местах: в базах данных, базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточены по всему предприятию. Слишком часто одна часть предприятия повторяет работу другой части просто потому, что невозможно найти и использовать знания, находящиеся в других частях предприятия.

Управление знаниями — это совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри предприятия.

Необходимость разработки систем КМ обусловлена следующими причинами:

работники предприятия тратят слишком много времени на поиск необходимой информации;

опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими;

ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен;

дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта.

Важность систем КМ обусловлена также тем, что знание, которое не используется

ине возрастает, в конечном счете становится устаревшим и бесполезным, так же, как деньги, которые сохранены без того, чтобы стать оборотным капиталом, в конечном счете теряют свою стоимость, пока не обесценятся. Напротив, знание, которое распространяется, приобретается и обменивается, генерирует новое знание.

Управление знаниям и корпоративная память Большинство обзоров концепции управления знания (КМ) уделяет внимание

только первичной обработке корпоративной информации типа электронной почты, программного обеспечения коллективной работы или гипертекстовых баз данных (например fWiig, 1996]). Они формируют существенную часть из необходимой, но определенно не достаточной технической инфраструктуры для управления знаниями.

Одним из новых решений по управлению знаниями является понятие корпоративной памяти (corporate memory), которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок.

Корпоративная память фиксирует информацию из различных источников предприятия и делает эту информацию доступной специалистам для решения производственных задач.

Корпоративная память не позволяет исчезнуть знаниям выбывающих специалистов (уход на пенсию, увольнение и пр.). Она хранит большие объемы данных, информации и знаний из различных источников предприятия. Они представлены в различных формах, таких как базы данных, документы и базы знаний.

При разработке систем КМ можно выделить следующие этапы:

1. Накопление. Стихийное и бессистемное накопление информации в организации. 2 Извлечение. Процесс, идентичный традиционному извлечению знаний для ЭС.

Это один из наиболее сложных и трудоемких этапов. От его успешности зависит дальнейшая жизнеспособность системы.

3 Структурирование. На этом этапе должны быть выделены основные понятия, выработана структура представления информации, обладающая максимальной наглядностью, простотой изменения и дополнения.

4 Формализация. Представление структурированной информации в форматах машинной обработки, то есть на языках описания данных и знаний.

5 Обслуживание. Под процессом обслуживания понимается корректировка формализованных данных и знаний (добавление, обновление): «чистка», то есть удаление

6

устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.

Если первые четыре этапа обычны для инженерии знаний, то последний является специфичным для систем управления знаниями. Как уже было сказано, он распадается на три более мелких процесса:

Корректировка формализованных знаний (добавление, обновление). Удаление устаревшей информации.

Фильтрация знаний для поиска информации, необходимой пользователю, выделяет компоненты данных и знаний, соответствующие требованиям конкретного пользователя. При помощи той же процедуры пользователь может узнать местонахождение интересующей его информации.

7