Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методика лаб_2.docx
Скачиваний:
117
Добавлен:
19.05.2015
Размер:
9.43 Mб
Скачать

Лабораторна робота №9

Проведення кластерного аналізу у системі STATISTICA

Мета роботи:

Вивчити процедуру проведення кластерного аналізу у системі STATISTICA.

Зауваження. Кластерний аналіз розв’язує задачі групування і класифікації об’єктів одразу за кількома ознаками. В підсумку кластерного аналізу розраховуються значення відстаней між об’єктами в уявному багатовимірному просторі, координатами якого є значення ознак, що враховуються під час досліду, і будуються спеціальні графіки - дендрограми, які наочно показують, наскільки близькі між собою об’єкти, що досліджуються, відразу за всією сукупністю їх властивостей, що були враховані у досліді.

Для вирішення задач в кластерному аналізі використовуються наступні методи: Joining (tree clustering) (ієрархічні агломеративні методи або деревовидна кластеризація), K - means clustering (метод К середніх), Two-way joining (двовхідне о`бєднання).

Кластерний аналіз має велике значення для використання в селекційній роботі, знаходить широке застосування при класифікації генотипів тварин.

Завдання

Під час дослідної роботи отримані і занесені в таблицю характеристики шести основних порід свиней за шістьма показниками хімічного складу м’язової тканини:

  1. гігроскопічна волога, %;.

  2. попіл, %;

  3. протеїн, %;

  4. клітковина, %;

  5. жир, %;

  6. безазотисті екстрактивні речовини, %.

За допомогою кластерного аналізу оцініть подібність наведених порід свиней одразу за всіма шістьма ознаками.

Дослідні дані наведені в таблиці 15.

15.Хімічний склад м’язової тканини свиней

Порода свиней

VAR 1

VAR 2

VAR 3

VAR 4

VAR 5

VAR 6

Велика біла Пшениця яра

13,4

1,9

13,6

1.8

2,0

67,3

Миргородська

13,4

1,8

11,4

1,8

1,9

69,7

Полтавська м’ясна

15,1

1,7

11,5

2,1

1,8

67,8

Ландрас

12,4

2,6

12,3

4,5

2,5

65,8

Українська степова біла

12,8

3,0

10,2

10,0

5,3

59,7

Велика чорна Кукурудза

13,3

1,5

9,6

2,6

5,1

67,9

Розглянемо принцип проведення кластерного аналізу на основі даних, які наведені в таблиці 15. В файлі знаходяться дані за хімічним складом м’язової тканини свиней різних порід і показники-аргументи, які беруть участь в класифікації.

Початок роботи

1. У своїй робочій папці створіть нову папку b9. Всі файли, які буде створено при виконанні даної роботи, зберігайте у цій папці.

2. Запустіть програму Статистика і у модулі Data Management/MFM створіть новий файл електронної таблиці для введення даних з таблиці. Збережіть цей файл під назвою Iab9.sta у свою робочу папку lab 9.

Зауваження. У першу змінну VAR1 будемо вводити гігроскопічну вологу (VOLOGA), у другу - кількість попелу (POPIL); у третю - кількість протеїну (PROTEIN), у четверту - кількість клітковини (KLITKOV), у п’яту - кількість жиру (ZHIR), у шосту - кількість - безазотистих екстрактивних речовин (BER).

3. У стовпчик NUMERIC VALUES (номера рядків) введіть назви порід свиней.

4. Виконайте команди: Статистика → Многомерные исследовательские методы → Анализ кластера.

На екрані з’явиться стартова панель модуля (рис.62) Clustering Method (методи кластерного аналізу): Joining (tree clustering) (ієрархічні агломеративні методи або деревовидна кластеризація), K - means clustering (метод К средніх), Two-way joining (двохвхідне об’єднання).

Рис. 62. Стартова панель модуля Clustering Method (методи кластерного аналізу)

У вікні Clustering Method оберіть параметр Joining (tree clustering) (вікно введення режимів роботи для ієрархічних агломеративних методів) процедура об’єднання - побудова дерева. Натиснути ОК.

5. У вікні, що відкрилось (рис.63), перейдіть на вкладнику Advanced натисніть кнопку Variables (дозволяє вибирати змінні, які беруть участь в класифікації) та виберіть всі змінні для аналізу (Select All). OK.

Рис.63. Вікно кластерний аналіз: ієрархічна класифікація

Рис. 63. Cluster Analysis: Joing (Tree Clustering)