- •«Санкт-Петербургский государственный электротехнический университет “лэти” имени в.И. Ульянова (Ленина)»
- •Рассмотрим базу погоды:
- •Применим к имеющимся данным алгоритмы обработки: Алгоритмы ассоциации:
- •Алгоритмы классификации:
- •Алгоритмы кластеризации:
- •Выводы:
- •Работа с подключенной базой данных: Текс данных:
- •Перевод данных:
- •Графики:
- •Данные:
- •Classify:
- •Cluster (em):
- •Associate (Apriori):
- •Select attributes (ChiSquaredAttributeEval – Ranker):
- •Visualize:
ФЕДЕРАЛЬНОЕ
АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное
образовательное учреждение высшего
профессионального образования
(СПбГЭТУ)
«Санкт-Петербургский государственный электротехнический университет “лэти” имени в.И. Ульянова (Ленина)»
Кафедра МОЭВМ
Лабораторная работа № 1
по дисциплине «БЗиЭС»
«Применение алгоритмов Data Mining с использованием прикладной программы Weka-3-5-6»
Выполнила студентка: Лысенко Е.С.
Группы: 4341
Проверила: Жукова Н.А.
Санкт-Петербург, 2007 г
Цель работы:
Ознакомиться с основами применения алгоритмов Data mining с использованием прикладной программы WEKA. Ознакомится с прикладной программой WEKA.
Знакомство с программой WEKA:
Для запуска программы WEKA-3-5-6, нам необходимо предварительно установить на рабочую машину (далее ПК) виртуальную Java машину. Мной была выбрана версия – jre-6u3-windows-i586-p-s.
Для запуска необходимо зайти в меню пуск и выбрать вкладку с WEKA (далее Века), выбрать необходимый режим и кликнуть по нему (кликнуть – нажать однократно на левую клавишу мыши при стандартном программировании клавиш мыши для правшей).
Мной был выбран вариант запуска с консолью:
После запуска перед нами открывается окно:
Загрузим данные, которые будем обрабатывать. Для этого необходимо:
После выбранного нами пункта меню, перед нами предстанет окно:
Далее необходимо загрузить данные:
Мной были выбраны данные по принципу – понимаем что написано – то есть, данные по погоде:
Открыв данные, перед нами предстает окно:
Мы можем просмотреть атрибуты, по которым производились измерения:
Перейдем к запуску алгоритмов:
Нам открылось следующее окно:
Подгрузим наш файл:
Рассмотрим базу погоды:
В базе используются номинальные атрибуты: OUTLOOK {SUNNY, OVERCAST, RAINY},
WINDY {true, false}, PLAY {yes, no}.
И атрибуты, принимающие числовые значения: TEMPERATURE, HUMIDITY.
Эти атрибуты принимали следующие значения:
OUTLOOK:
TEMPERATURE:
HUMIDITY:
WINDY:
PLAY:
Применим к имеющимся данным алгоритмы обработки: Алгоритмы ассоциации:
Так как такие алгоритмы не работают с числовыми атрибутами, то удалим из списка атрибуты TEMPERATURE и HUMIDITY, и попробуем построить результат с помощью оставшихся атрибутов.
APRIORI:
Scheme: weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0
Relation: weather-weka.filters.unsupervised.attribute.Remove-R2-3
Instances: 14
Attributes: 3
outlook
windy
play
=== Associator model (full training set) ===
Apriori
=======
Minimum support: 0.1
Minimum metric <confidence>: 0.9
Number of cycles performed: 18
Generated sets of large itemsets:
Size of set of large itemsets L(1): 7
Size of set of large itemsets L(2): 15
Size of set of large itemsets L(3): 8
Best rules found:
1. outlook=overcast 4 ==> play=yes 4 conf:(1)
2. outlook=rainy windy=FALSE 3 ==> play=yes 3 conf:(1)
3. outlook=rainy play=yes 3 ==> windy=FALSE 3 conf:(1)
4. outlook=rainy windy=TRUE 2 ==> play=no 2 conf:(1)
5. outlook=rainy play=no 2 ==> windy=TRUE 2 conf:(1)
6. outlook=overcast windy=FALSE 2 ==> play=yes 2 conf:(1)
7. outlook=overcast windy=TRUE 2 ==> play=yes 2 conf:(1)
8. windy=FALSE play=no 2 ==> outlook=sunny 2 conf:(1)
PredictiveApriori:
Scheme: weka.associations.PredictiveApriori -N 100
Relation: weather-weka.filters.unsupervised.attribute.Remove-R2-3
Instances: 14
Attributes: 3
outlook
windy
play
=== Associator model (full training set) ===
PredictiveApriori
===================
Best rules found:
1. outlook=overcast 4 ==> play=yes 4 acc:(0.89255)
2. outlook=rainy windy=FALSE 3 ==> play=yes 3 acc:(0.83487)
3. outlook=rainy play=yes 3 ==> windy=FALSE 3 acc:(0.83487)
4. outlook=rainy windy=TRUE 2 ==> play=no 2 acc:(0.75023)
5. outlook=rainy play=no 2 ==> windy=TRUE 2 acc:(0.75023)
6. windy=FALSE play=no 2 ==> outlook=sunny 2 acc:(0.75023)
7. windy=FALSE 8 ==> play=yes 6 acc:(0.58605)
8. play=yes 9 ==> windy=FALSE 6 acc:(0.55876)
9. outlook=sunny 5 ==> windy=FALSE 3 acc:(0.49768)
10. outlook=sunny 5 ==> play=no 3 acc:(0.49768)
11. outlook=sunny 5 ==> windy=TRUE 2 acc:(0.41025)
12. outlook=sunny 5 ==> play=yes 2 acc:(0.41025)
13. outlook=sunny 5 ==> windy=FALSE play=no 2 acc:(0.41025)
Как видно, алгоритмы дали несколько разные результаты.