- •Методичні вказівки
- •Лабораторна робота №1 Знайомство з gui інтерфейсом бібліотеки data mining алгоритмів
- •1.1. Вступ
- •1.2. Завантаження і проглядання початкових даних
- •1.3. Інформація про атрибути даних
- •1.4. Статистична інформація про дані
- •1.5. Побудова mining моделі
- •1.7. Представлення моделі у форматі pmml
- •1.8. Використання моделі
- •Лабораторна робота №2 Виконання аналізу даних методами data mining
- •2.1. Вступ
- •2.2 Підготовка початкових даних
- •2.2.1 Заголовок
- •2.3.Настройка процесу побудови mining моделі
- •2.3.1. Настройки для асоціативних правил і сиквенциального аналізу
- •2.3.2. Настройки для дерев рішень (Decision Tree Mining Model)
- •2.3.3. Настройки для математичної залежності побудованої методом svm
- •2.3.4. Настройки кластерної моделі
- •2.4.Анализ моделей
- •2.4.1 Візуалізація асоціативних правил
- •2.4.2. Візуалізація дерев рішень
- •2.4.3. Візуалізація ієрархічної кластеризації
1.8. Використання моделі
Моделі класифікації і регресії, що будуються для задач, використовуються для передбачаючих цілей на нових даних. Отже вони можуть бути застосовані до інших даних. Для цього необхідно натискувати кнопку Apply Model на панелі інструментів або вибравши пункт меню Model | Apply або опцію Apply Model в діалоговому вікні представленому на Рис. 1.9. В результаті буде запропоновано вибрати файл з новими даними, записаними у форматі arff (буде відкрито діалогове вікно аналогічне представленому на Рис. 1.1.). Після вибору файлу і вживання побудованої моделі буде відображено вікно в якому нові дані будуть представлені в табличному вигляді (Рис. 1.11).
Рис. 1.11. Результат використання моделі до нових даних.
У вікні, що відкрилося, у вигляді таблиці будуть представлені класифіковані дані. Як видно таблиця алогічна тій же представлена на рис. 1.2. Різниця полягає в новій колонці predicted_* класифікації, що описує результат (* - замінюється на атрибут класифікації). У вікні також виводиться інформація про ступінь помилки класифікації (Error rate).
Порядок виконання роботи
Відкрити GUI інтерфейс бібліотеки Xelopes.
Завантажити початкові дані з файлу transact.arff.
Проглянути завантажені дані.
Проглянути інформацію про атрибути даних.
Проглянути статистичну інформацію про дані.
Побудувати модель Association Rules Mining Model.
Візуалізувати побудовану модель.
Переглянути і зберегти модель у форматі PMML.
Виконати пункти 2-5 для даних з файлу weather-nominal.arff.
Виконати пункти 6 - 8 для моделі Decision Tree Mining Model.
Застосувати модель до даних з файлу weather-nominal.arff.
Виконати пункти 6 - 8 для моделі Hierarchical Clustering Mining Model.
Звіт по роботі
Титульний лист.
Мета роботи.
Дані з файлів transact.arff и weather.arff в табличному вигляді.
Інформація про атрибути даних з файлів transact.arff и weather-nominal.arff
Статистична інформація за даними з файлів transact.arff и weather-nominal.arff
Копії візуалізації моделей Association Rules Mining Model, Decision Tree Mining Model і Hierarchical Clustering Mining Model згідно стандарту.
Результат вживання моделі Decision Tree Mining Model до даних з файлу weather-nominal.arff
Висновки по роботі.
Контрольні питання
Яку статистичну інформацію можна одержати засобами GUI Xelopes.
Які існують типи атрибутів і їх характеристики.
Які mining моделі можна побудувати засобами GUI Xelopes.
Які існують mining моделі не реалізовані в GUI Xelopes.
Які дії можна виконати з моделлю.
Представлення моделі у форматі PMML.
Лабораторна робота №2 Виконання аналізу даних методами data mining
Мета роботи: Вивчити основні етапи інтелектуального аналізу даних з використанням алгоритмів data mining реалізованих в бібліотеці Xelopes.
Завдання: Для даних з файлу визначених варіантом завдання побудувати моделі також відповідно до варіанту завдання за допомогою різних алгоритмів і пояснити результати.
Загальні відомості
2.1. Вступ
Процес інтелектуального аналізу даних складається з наступних основних етапів:
Підготовка даних у вигляді зручному для вживання методів data mining
Настройка процесу побудови mining моделі
Побудова mining моделі
Аналіз побудованої mining моделі
У разі supervised моделі вживання її до нових даних