ЛР_3
.docxГУАП
КАФЕДРА № 82
ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ
ПРЕПОДАВАТЕЛЬ
доцент |
|
|
|
В.С. Блюм |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЁТ ПО ЛАБОРАТОРНОЙ РАБОТЕ №3 |
Интеллектуальный анализ данных. Метод деревьев принятия решений |
по курсу: ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ |
|
|
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ ГР. |
|
|
|
|
|
|
|
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург 201
Цель работы: разобрать применения метода принятия решений к заданному набору данных.
Результат выполнения работы:
Запустим программу RapidMiner.
Откроем во вкладке Repository папку Samples. В Samples откроем папку processes и затем откроем папку 01_Learner (рисунок 1).
Рисунок 1 – Папка 01_Learner
Затем в папке 01_Learner откроем файл 01_DecisionTree (рисунок 2).
Рисунок 2 – Файл 01_DecisionTree
Получим результат (рисунок 3).
Рисунок 3 – Результат
Нажмём кнопку Start и посмотрим результаты (рисунок 4)
Рисунок 4 – Выполнение процесса
Перейдём во вкладку Description (рисунок 5).
Рисунок 5 – Вкладка Description
Вернёмся в вид Design, нажмём на процесс Retrieve ЛКП и увидим список хранилищей (рисунок 6).
Рисунок 6 - Список хранилищей
Откроем Golf (рисунок 7).
Рисунок 7 - Golf
Откроем статистику (рисунок 8).
Рисунок 8 - Статистика
Добавим модификацию метода принятия решений Decision Stump к Продаже игр.
Соединим out с tra и mod c res (рисунок 9).
Рисунок 9 – Соединение с Decision Stump
Запустим процесс (рисунок 10).
Рисунок 10 – Graph
На примере рисунка 11 видно, что благодаря такому представлению данных моего набора можно легко проследить до нижних уровней соотношение каждого элемента. Например, в промежуток с середины 2013 года по середину 2014 продажи игр на платформе PS4 превысило 17365 тысяч экземпляров (рисунок 11)
Рисунок 11 – ветвь построенное дерева
Перейдём в Description (рисунок 12).
Рисунок 22 – Description
Откроем Golf-Testset (рисунок 13).
Рисунок 33 – Testset
Перейдём в Статистику (рисунок 14).
Рисунок 44 – Статистика
Вывод: в этой лабораторной работе я научился применять разные методы принятия решений в наборах данных.