Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методика лаб_2.docx
Скачиваний:
117
Добавлен:
19.05.2015
Размер:
9.43 Mб
Скачать

(Вікно введення режимів роботи для ієрархічних агломеративних методів)

У полі Input fill (тип вхідної інформації) залиште значення Raw data.

У полі Cluster (режим класифікації за ознаками або об’єктами)) встановіть значення Cases (raws), оскільки у вихідній таблиці породи свиней розташовані саме по рядках. ОК.

Можна вказати Amalgamation (linkage) rule (правило об’єднання) і Distance measure (метрика відстаней). Codes for grouping variable (коди для груп змінної) будуть вказувати кількість аналізованих груп об’єктів. Missing data (пропущені змінні) дозволяє вибрати або построкове видалення змінних із списку, або замінити їх на середнє значення. Open Data –дозволяє відкрити файл з даними. Причому можна вказати вимоги вибору спостережень із бази даних -кн. Select Cases. Можна задавати вагу змінним, вибравши їх із списку -кн. W.

6. У вікні Joining Results клацніть кнопку Vertical icicle plot (вертикальне дерево кластеризації). Таке подання результатів звичайно є більш наочним.

Після задання всіх необхідних параметрів і натискання кнопки ОК будуть виконані обчислення, а на екрані з’явиться вікно, яке включає в себе результати кластерного аналізу "Joining Results" рис.64.

Рис.64. Вікно, яке включає в себе результати кластерного аналізу"Joining Results"підсумок результатів та їх аналіз

Інформаційна частина діалогового вікна Joining Results Discriminant Function Analisis Results (результати аналізу кластерних функцій) повідомляє, що

  • Number of variables-кількість змінних;

  • Number of cases – кількість спостережень;

  • Missing data were casewise deleted – здійснена класифікація спостережень або змінних (залежить від рівня параметру в рядку Cluster в попередньому вікні налаштування.);

  • Amalgation (joing) rule - правило об’єднання кластерів (назва ієрархічного агломеративного методу, заданого в рядку Amalgation rules, а в попередньому вікні налаштування);

  • Distanse.metric is - Метрика відстані (залежить від установки в рядку Distance measure в попередньому вікні налаштування.

Одержаний графік (рис.65), на якому породи розташовані вздовж вісі абсцис (якщо ви не вводили назви порід у базі даних, то вони позначені символами С1 - С6).

Рис.65. Vertical icicle plot (Вертикальная дендрограмма)

Чим нижче пролягають лінії, що пов’язують окремі породи, тим вони більш схожі за комплексом ознак.

Графік показує, що за комплексом ознак найбільш ізольованим є свині великої чорної породи, а найбільш подібними за комплексом ознак є полтавська м’ясна і ландрас. За своїми властивостями до них найближчим є велика біла. Ізольовані проміжні позиції займають миргородська та українська степова біла породи свиней.

Збережіть цей графік у свою робочу папку lаb10.

7. Поверніться у вікно Joining Results та перейдіть на вкладинку Advanced.

8. Натисніть кнопку Distance matrix (рис. 66).

У вікні, що з’явилося, можна переглянути і вивчити відстані між всіма породами (рис.67).

Легко бачити, що змінні велика біла та українська степова біла породи дійсно знаходяться одна від одної на найменшій з усіх відстані.

Закрийте всі відкриті вікна і вимкніть програму Статистика.

Рис.66. Вікно - результати ієрархічної класифікації

Рис.67.Вікно – Евклидова відстань

Тепер уявімо собі, що поступово (дуже малими кроками) ви «послаблюєте» ваш критерій про те, які об’єкти є унікальними, а які ні. Іншими словами ви знижуєте поріг, що відноситься до рішення про об’єднання двох або більше об’єктів в один кластер.

В результаті ви пов’язуєте разом все більше і більше число об’єктів і об’єднуєте все більше і більше число кластерів, що складаються з елементів, що більше різняться між собою. Остаточно на останньому кроці всі об’єкти об’єднуються разом. Коли дані мають зрозумілу «структуру» в термінах кластерів об’єктів, що схожі між собою, тоді ця структура, скоріше за все повинна бути відображена в ієрархічному дереві різними гілками. В результаті успішного аналізу методом об’єднання з’являється можливість виявити кластери (гілки) та інтерпретувати їх. Щоб повернутися до вікна, яке містить інші результати кластерного аналізу, необхідно натиснути на Continue та вибрати вікно Схема обьединения (рис. 68). Натисканням мишки можна розкривати рядок Amalgamation schedule, який містить протокол об’єднання кластерів (рис.69.).

Рис.68.Вікно відбору схеми об’єднання кластерів

Рис.69. Amalgamation schedule (Метод одиночного зв’язку)

В заголовку вказано ієрархічний агломеративний метод і метрика відстані. Таблиця може займати декілька вікон.

Наступною у вікні результатів йде кнопка Graph of amalgamation schedule. Після натискання, відкривається вікно, яке містить ступінчате графічне зображення змінення відстані при з`єднанні кластерів рис.70.

Рис.70. Вікно Graph of amalgamation schedule (Діаграма расс. обьединения по шагам)

Повернувшись в головне вікно результатів і класифікацій для перегляду матриці відстані необхідно здійснити натискання на рядку Distance matrix (рис.71).

Рис.71. Вікно матриці відстаней (Евклидова відстань)

В головному вікні результатів класифікації є рядок Save distance matrix as: (Зберегти матрицю відстані як:) дозволяюча задати ім`я файлу, в якому буде збережена матриця відстані, яка в подальшому буде підлягати обробці.

Рядок Discriptive statistics містить такі важливі описові статистики, як середнє (means) та середньоквадратичне відхилення (standart deviations) для кожного нагляду (рис.72).

Рис.72. Вікно описових статистик

При проведенні класифікації N об`єктів за k признаками, для користувача великий інтерес складають значення цих показників для кожного признаку. Для того, щоб ці характеристики розраховувались саме за признаками, необхідно повернутися в головне вікно (рис.73) вказати зміни та натиснути ОК.

Рис. 73. Вікно двухходовое об’єднання

В вікні, яке відкривається (рис.74) вибрати функцію «Диаграмма двухходового обьединения» та натиснути ОК.

Рис.74. Вікно результати двухходового обьединения

В вікні, яке з’явиться буде представлена діаграма двухходового обьединения (рис.75).

Рис.75.Вікно результатів кластеризації методом