- •Интеллектуальный анализ данных
- •Изучение алгоритмов построения деревьев решений с целью выявления закономерностей
- •Типа «Если – То»
- •(Системы see5/c5 и tree analyzer)
- •Интеллектуальный анализ данных Изучение алгоритмов построения деревьев решений с целью выявления закономерностей типа «Если – То»
- •1 Теоретическая часть
- •1.1 Деревья решений
- •2 Построение деревьев решений — система See5/c5.0
- •Подготовка данных для See5
- •Файл имен переменных
- •Файл данных
- •Файлы тестовых данных (необязательные)
- •Файл стоимости
- •Интерфейс пользователя
- •Построение дерева решений
- •Преобразование дерева решений в набор правил
- •Усиление решения (Boosting)
- •Использование правил для принятия решений
- •Смягчение порогов
- •Дополнительные настройки алгоритма
- •Перекрестная проверка
- •Выборка из больших наборов данных
- •Учет стоимости различных ошибок классификации
- •Предсказанный класс, истинный класс: стоимость ошибки,
- •Детальная проверка и сохранение результатов
- •3 Задание на лабораторную работу
- •Правила подготовки данных для работы в системе See-5 Вариант 1
- •Правила подготовки данных для работы в системе See Вариант 2
- •Подготовка данных в системе Tree_Analyser
- •4 Отчет должен содержать
- •5 Вопросы для защиты
- •Список литературы
Правила подготовки данных для работы в системе See Вариант 2
Данные файла Excel Eперенести в Word. При этом номер участка не переносить, вместо этого столбца создать столбец «Номер класса».
Таблицу преобразовать: «Таблица» - «Преобразовать» - «В текст».
Добавить пробел перед запятой: «Правка» - «Найти» - «Заменить» - «,» на «, »
Запомнить файл как текстовый.
Изменить расширение файла .txt на .data
Создать в Word файл имен переменных в соответствии с требованиями, описанными в методичке.
Задать этому файлу расширение .names
Данные готовы.
Подготовка данных в системе Tree_Analyser
Подготовить данные в Exel в соответствии с требованиями по решению задачи классификации
Запомнить файл *.xls как файл *.dbf
Открыть Tree_Analyser
Открыть новый файл
Создать новое подключение (Таблица в папке), считать подготовленный файл *.dbf
Определить целевое поле (класс) как дискретное
Остальные поля – входные
Обучение производить с настройками по умолчанию
По нажатию «Готово» визуализировать дерево
4 Отчет должен содержать
Название и цель работы
Исходные данные варианта задания
Результаты построения деревьев решений в системе See5:
Построенные деревья решений
Выявленные правила классификации
4 Результаты построения деревьев решений в системе Tree Analyzer:
Построенные дерево решений и извлеченные правила в Tree Analyzer
Выявленные правила классификации
Построение дерева решений вручную по алгоритму CLS
Сравнительный анализ трех построенных деревьев решений. Выводы.
5 Вопросы для защиты
Постановка задачи построения логических алгоритмов с помощью деревьев решений
Обобщенный алгоритм построения деревьев решений
Деревья решений. Алгоритм CLS построения деревьев решений.
Основные проблемы построения деревьев решений.
Деревья решений. Достоинства и недостатки. Алгоритм «Кора».
Список литературы
Романов В.П. Интеллектуальные информационные системы в экономике: Учебное пособие / Под ред. д.э.н., проф. Н.П.Тихомирова. – М.: Издательство «Экзамен», 2003. – 496 с.
Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. - М.:Финансы и статистика, 2004.-.424с.: ил.
Дюк В., Самойленко А. Data Mining: учебный курс.-.СПб:Питер,2001. – 368с.
Дубров А.М. Компонентный анализ и эффективность в экономике: Учеб. пособие. – М.: Финансы и статистика, 2002. – 352 с.: ил.
Корнеев В.В., Гарре А.Ф., Васюткин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. – М.:Издатель Молгачева С.В., Изд-во Нолидж, 2001. – 496 с.