Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа / 2008-03-11-12-05-Екатерина-1.doc
Скачиваний:
48
Добавлен:
01.05.2014
Размер:
679.42 Кб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

«Санкт-Петербургский государственный электротехнический университет “лэти” имени в.И. Ульянова (Ленина)»

(СПбГЭТУ)

Кафедра МОЭВМ

Лабораторная работа № 1

по дисциплине «БЗиЭС»

«Применение алгоритмов Data Mining с использованием прикладной программы Weka-3-5-6»

Выполнила студентка: Лысенко Е.С.

Группы: 4341

Проверила: Жукова Н.А.

Санкт-Петербург, 2007 г

Цель работы:

Ознакомиться с основами применения алгоритмов Data mining с использованием прикладной программы WEKA. Ознакомится с прикладной программой WEKA.

Знакомство с программой WEKA:

Для запуска программы WEKA-3-5-6, нам необходимо предварительно установить на рабочую машину (далее ПК) виртуальную Java машину. Мной была выбрана версия – jre-6u3-windows-i586-p-s.

Для запуска необходимо зайти в меню пуск и выбрать вкладку с WEKA (далее Века), выбрать необходимый режим и кликнуть по нему (кликнуть – нажать однократно на левую клавишу мыши при стандартном программировании клавиш мыши для правшей).

Мной был выбран вариант запуска с консолью:

После запуска перед нами открывается окно:

Загрузим данные, которые будем обрабатывать. Для этого необходимо:

После выбранного нами пункта меню, перед нами предстанет окно:

Далее необходимо загрузить данные:

Мной были выбраны данные по принципу – понимаем что написано – то есть, данные по погоде:

Открыв данные, перед нами предстает окно:

Мы можем просмотреть атрибуты, по которым производились измерения:

Перейдем к запуску алгоритмов:

Нам открылось следующее окно:

Подгрузим наш файл:

Рассмотрим базу погоды:

В базе используются номинальные атрибуты: OUTLOOK {SUNNY, OVERCAST, RAINY},

WINDY {true, false}, PLAY {yes, no}.

И атрибуты, принимающие числовые значения: TEMPERATURE, HUMIDITY.

Эти атрибуты принимали следующие значения:

OUTLOOK:

TEMPERATURE:

HUMIDITY:

WINDY:

PLAY:

Применим к имеющимся данным алгоритмы обработки: Алгоритмы ассоциации:

Так как такие алгоритмы не работают с числовыми атрибутами, то удалим из списка атрибуты TEMPERATURE и HUMIDITY, и попробуем построить результат с помощью оставшихся атрибутов.

APRIORI:

Scheme: weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0

Relation: weather-weka.filters.unsupervised.attribute.Remove-R2-3

Instances: 14

Attributes: 3

outlook

windy

play

=== Associator model (full training set) ===

Apriori

=======

Minimum support: 0.1

Minimum metric <confidence>: 0.9

Number of cycles performed: 18

Generated sets of large itemsets:

Size of set of large itemsets L(1): 7

Size of set of large itemsets L(2): 15

Size of set of large itemsets L(3): 8

Best rules found:

1. outlook=overcast 4 ==> play=yes 4 conf:(1)

2. outlook=rainy windy=FALSE 3 ==> play=yes 3 conf:(1)

3. outlook=rainy play=yes 3 ==> windy=FALSE 3 conf:(1)

4. outlook=rainy windy=TRUE 2 ==> play=no 2 conf:(1)

5. outlook=rainy play=no 2 ==> windy=TRUE 2 conf:(1)

6. outlook=overcast windy=FALSE 2 ==> play=yes 2 conf:(1)

7. outlook=overcast windy=TRUE 2 ==> play=yes 2 conf:(1)

8. windy=FALSE play=no 2 ==> outlook=sunny 2 conf:(1)

PredictiveApriori:

Scheme: weka.associations.PredictiveApriori -N 100

Relation: weather-weka.filters.unsupervised.attribute.Remove-R2-3

Instances: 14

Attributes: 3

outlook

windy

play

=== Associator model (full training set) ===

PredictiveApriori

===================

Best rules found:

1. outlook=overcast 4 ==> play=yes 4 acc:(0.89255)

2. outlook=rainy windy=FALSE 3 ==> play=yes 3 acc:(0.83487)

3. outlook=rainy play=yes 3 ==> windy=FALSE 3 acc:(0.83487)

4. outlook=rainy windy=TRUE 2 ==> play=no 2 acc:(0.75023)

5. outlook=rainy play=no 2 ==> windy=TRUE 2 acc:(0.75023)

6. windy=FALSE play=no 2 ==> outlook=sunny 2 acc:(0.75023)

7. windy=FALSE 8 ==> play=yes 6 acc:(0.58605)

8. play=yes 9 ==> windy=FALSE 6 acc:(0.55876)

9. outlook=sunny 5 ==> windy=FALSE 3 acc:(0.49768)

10. outlook=sunny 5 ==> play=no 3 acc:(0.49768)

11. outlook=sunny 5 ==> windy=TRUE 2 acc:(0.41025)

12. outlook=sunny 5 ==> play=yes 2 acc:(0.41025)

13. outlook=sunny 5 ==> windy=FALSE play=no 2 acc:(0.41025)

Как видно, алгоритмы дали несколько разные результаты.