- •Лекция Методы и проблемы извлечения знаний.
- •Лингвистический аспект касается исследований языковых проблем общения.
- •Классификация вопросов
- •По форме По функции По воздействию
- •Активные групповые методы извлечения знаний
- •Текстологические методы извлечения знаний
- •Алгоритмы извлечения знаний из текста
Лекция Методы и проблемы извлечения знаний.
Стратегии получения знаний.
Извлечение знаний – процедура взаимодействия эксперта с источником знаний, в результате которой становится явным процесс рассуждений специалистов при принятии решения и структура их представлений о ПО.
Процесс извлечения знаний при разработке ЭС является сложным этапом.
Существуют следующие реальные трудности извлечения знаний:
Организационные неувязки
неудачный метод извлечения, несовпадающий со структурой знаний в данной области
неадекватная модель (язык) представления знаний
неумение наладить контакт экспертом
терминологический разнобой
отсутствие целостной системы знаний в результате извлечения только фрагментов и т.д.
Процесс извлечения знаний – длительная и трудоемкая процедура, в которой инженеру по знаниям, владеющему когнитивной психологией, системным анализом, математической логикой и др., необходимо воссоздать модель ПО, которой пользуются эксперты для принятия решения.
Приобретение знаний – процесс наполнения БЗ экспертом с использованием специализированных программных средств.
Например, система TEIRESIAS (1982), ставшая прародительницей всех инструментариев для приобретения знаний ЭС MYCIN.
Формирование знаний (машинное обучение) – процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.
К задачам машинного обучения относятся:
задачи прогнозирования;
идентификации функций;
расшифровка языков;
индуктивный вывод.
Обучение по примерам. Источник знаний – множество примеров из ПО.
Без применения ЭВМ С применением ЭВМ
Извлечение знаний
Приобретение знаний Формирование знаний
(машинное обучение)
Извлечение знаний. Теоретический аспект.
Теоретический аспект знаний складывается:
психологический;
лингвистический;
гносеологический.
Психологический аспект является ведущим, обеспечивает эффективность взаимодействия между экспертом и инженером по знаниям.
Рис. Потери информации при разговорном общении.
Необходима атмосфера сотрудничества.
Важны: пол, возраст, личность, темперамент, мотивация.
пол: гетерогенные пары м/ж.
Возраст: 20>(Вэ-ВА)>5.
Рекомендуемые компоненты личных черт для аналитика: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, большая собранность, настойчивость, общительность, находчивость).
Темперамент = {холерик, сангвиник, меланхолик, флегматик}
Флегматики и меланхолики медленнее усваивают информацию, но легче усваивают новое. Тем беседы медленней, нельзя торопить с ответами.
- Мотивация: стремление к успеху (стимулы для эксперта).
3) Процесс проведения процедуры извлечения знаний:
Место проведения сеансов: небольшой кабинет;
Отсутствие телефона и других помех;
Дистанция беседы 1,2-3 метра;
Продолжительность беседы 1,5-2 часа;
Паузы через 20-25 мин.
Большая часть информации является зрительной. Используются слайды, чертежи, рисунки.
Протоколировать результаты беседы можно:
запись на бумагу (наиболее распространена);
диктофон;
память.
Фразы длиной 72 слова (минимальная потеря информации);
Учет невербальной информации от эксперта (в форме ремарок).