Результати кластеризації методом k-середніх
Таблица данных1 |
||||||||||
|
z1 |
z2 |
z3 |
z4 |
z5 |
z6 |
z7 |
НАБЛ_НО |
КЛАСТЕР |
РАССТ. |
C_1 |
2,45516335 |
0,720977022 |
-0,263874537 |
-0,353375982 |
0,387998175 |
-0,926786393 |
-0,655985513 |
1 |
2 |
0,92 |
C_2 |
0,687979226 |
0,378855606 |
-0,479256886 |
-0,83957792 |
-0,519099456 |
0,742396565 |
0,283200794 |
2 |
2 |
0,52 |
C_3 |
-0,823574486 |
0,762097384 |
-0,511815152 |
0,691939953 |
-0,0798131815 |
2,07118103 |
0,138710593 |
3 |
1 |
0,82 |
C_4 |
-0,29008494 |
0,523599282 |
-0,762519737 |
0,059395707 |
-0,122600806 |
-0,404787359 |
0,9334067 |
4 |
2 |
0,48 |
C_5 |
0,0544603911 |
-0,494540892 |
0,690261871 |
-0,532648477 |
-0,549906545 |
0,556165408 |
1,3668773 |
5 |
2 |
0,84 |
C_6 |
-0,995847151 |
0,98743697 |
-0,20804331 |
1,11301542 |
-0,0798131815 |
-0,926786393 |
-0,00577960805 |
6 |
2 |
0,79 |
C_7 |
-0,101140726 |
-1,22977297 |
0,622635122 |
0,191756868 |
-0,879086 |
-0,675825319 |
-0,0780247086 |
7 |
3 |
0,58 |
C_8 |
0,565721205 |
0,336090429 |
-0,235841717 |
-0,900270715 |
2,1537008 |
2,07118103 |
-0,655985513 |
8 |
1 |
0,78 |
C_9 |
0,265633336 |
0,526888911 |
-0,748403313 |
-0,460752524 |
0,154092497 |
-0,675825319 |
-0,648761003 |
9 |
2 |
0,34 |
C_10 |
0,210061508 |
-1,47485033 |
1,84327659 |
-0,2368763 |
-0,873666234 |
-0,542963574 |
-0,525944332 |
10 |
3 |
0,57 |
C_11 |
-0,55127253 |
-0,361310918 |
-0,300294408 |
0,158457382 |
-0,804635534 |
-0,260971298 |
-0,930516896 |
11 |
2 |
0,59 |
C_12 |
-1,9794685 |
-2,27916462 |
2,38602481 |
2,95598553 |
-0,664577378 |
0,378211192 |
-0,894394345 |
12 |
3 |
1,03 |
C_13 |
0,943609633 |
-0,246173903 |
-0,0094769045 |
-0,929048975 |
-0,524519221 |
-1,04542254 |
-0,164718829 |
13 |
2 |
0,53 |
C_14 |
-0,429014509 |
0,716042578 |
-0,779502434 |
-0,425137175 |
2,38475397 |
-0,404787359 |
2,68173813 |
14 |
1 |
1,04 |
C_15 |
-0,0122258021 |
1,13382546 |
-1,24316999 |
-0,492862789 |
0,0171720998 |
0,0450203195 |
-0,843822775 |
15 |
2 |
0,57 |
Отже, метод кластеризації k-середніх розподілив підприємства, помістивши їх в кожний кластер відповідно їх значенням. До 1 кластеру потрапили 3 підприємства, а саме: 3, 8, 14. До 2 кластеру потрапили 8 підприємств: 1, 2, 4, 5, 6, 9, 13, 15. До 3 кластеру потрапили 3 підприємства: 7, 10, 12.
Для визначення чи правильно проведена кластеризація і стійкість розбиття на кластери використаємо Дискримінантний метод на основі апостріорних імовірностей (отриманими на основі досвіду про розподіл) (таблиця 5).
Таблиця 5
Результати Дискримінантного методу на основі апостеріорних імовірностей
Апостериорные вероятности (Таблица данных1) Неправильные классификации отмечены * |
||||
|
Наблюд. |
G_1:1 |
G_2:2 |
G_3:3 |
1 |
G_2:2 |
0,000000 |
0,999989 |
0,000010 |
2 |
G_2:2 |
0,000151 |
0,999848 |
0,000000 |
3 |
G_1:1 |
0,987944 |
0,012056 |
0,000000 |
4 |
G_2:2 |
0,000041 |
0,999958 |
0,000001 |
5 |
G_2:2 |
0,000042 |
0,998952 |
0,001006 |
6 |
G_2:2 |
0,000000 |
0,999984 |
0,000016 |
7 |
G_3:3 |
0,000000 |
0,042129 |
0,957871 |
8 |
G_1:1 |
1,000000 |
0,000000 |
0,000000 |
9 |
G_2:2 |
0,000001 |
0,999984 |
0,000014 |
10 |
G_3:3 |
0,000000 |
0,000347 |
0,999653 |
11 |
G_2:2 |
0,000000 |
0,984280 |
0,015720 |
12 |
G_3:3 |
0,000000 |
0,000001 |
0,999999 |
13 |
G_2:2 |
0,000000 |
0,985446 |
0,014554 |
14 |
G_1:1 |
0,999997 |
0,000003 |
0,000000 |
15 |
G_2:2 |
0,000130 |
0,999870 |
0,000000 |
Неправильні результати класифікації можуть біти відмічені «*», але оскільки вони відсутні, це може свідчити про правильність проведення кластеризації. За даними таблиці 5 отримуємо:
8 підприємство потрапило у 1 кластер з ймовірністю 1,0 тобто достовірно, з незначним відхиленням до 1 кластеру також потрапляють підприємство 14 з ймовірністю о,99 та підприємство з ймовірністю 0,98.
1,2,4, 5, 6,9, 15,11 підприємство потрапили у 2 кластер з ймовірністю 0,99, та підприємство 13 з ймовірністю 0,98;
Всі інші підприємства потрапили у 3 кластер з ймовірністю 0,99.
Отже, розподіл підприємств за латентною ознакою «Інвестиційна привабливість» на кластери здійснено абсолютно достовірно.
Рис. 3. Аналіз впливу факторів на включення підприємства у кластер
Отримали діаграму, кольором показується, яка змінна більш всього впливає на підприємство і на включення його до певного кластеру. Це додатково характеризує ступінь впливу фактора на потрапляння підприємства до кластеру та на формування кластеру.
Отже, наприклад, за результатами аналізу, бачимо, що на віднесення 3 і 8 підприємства до кластеру більше всього вплинув фактор собівартості одиниці продукції – z6, на віднесення 1 підприємства до кластера більше всього вплинув фактор середньорічної вартості ОПФ – z1. На віднесення підприємства 12 до кластеру найбільше вплинув фактор кредиторської заборгованості z7
Для отримання більш повної характеристики отриманих кластерів, необхідно використовувати ще одну операцію багатовимірної класифікації - метод подвійного об'єднання. Цей метод полягає в одночасній угрупованню як спостережень (підприємств), так і змінних (факторів). Ключове місце в алгоритмі займає бар'єрне значення параметра подвійного об'єднання, яке визначає, коли метод враховує одночасну близькість в обох характеристиках досліджуваної сукупності. Для проведення аналізу необхідно побудувати перевпорядковану матрицю, використавши модулі Статистики «Двухвходовое объединение». (Таблиця 6)
Таблиця 6
Результати двухвходового об’нання (Перевпорядкована матриця)
Переупорядоч.матрица (Таблица данных1) |
|||||||
|
z1 |
z2 |
z5 |
z7 |
z6 |
z3 |
z4 |
C_1 |
2,45516 |
0,72098 |
0,387998 |
-0,655986 |
-0,92679 |
-0,26387 |
-0,353376 |
C_9 |
0,26563 |
0,52689 |
0,154092 |
-0,648761 |
-0,67583 |
-0,74840 |
-0,460753 |
C_15 |
-0,01223 |
1,13383 |
0,017172 |
-0,843823 |
0,04502 |
-1,24317 |
-0,492863 |
C_2 |
0,68798 |
0,37886 |
-0,519100 |
0,283201 |
0,74240 |
-0,47926 |
-0,839578 |
C_13 |
0,94361 |
-0,24617 |
-0,524519 |
-0,164719 |
-1,04542 |
-0,00948 |
-0,929049 |
C_5 |
0,05446 |
-0,49454 |
-0,549907 |
1,366877 |
0,55617 |
0,69026 |
-0,532648 |
C_3 |
-0,82357 |
0,76210 |
-0,079813 |
0,138711 |
2,07118 |
-0,51182 |
0,691940 |
C_6 |
-0,99585 |
0,98744 |
-0,079813 |
-0,005780 |
-0,92679 |
-0,20804 |
1,113015 |
C_4 |
-0,29008 |
0,52360 |
-0,122601 |
0,933407 |
-0,40479 |
-0,76252 |
0,059396 |
C_11 |
-0,55127 |
-0,36131 |
-0,804635 |
-0,930517 |
-0,26097 |
-0,30029 |
0,158457 |
C_14 |
-0,42901 |
0,71604 |
2,384754 |
2,681738 |
-0,40479 |
-0,77950 |
-0,425137 |
C_8 |
0,56572 |
0,33609 |
2,153701 |
-0,655986 |
2,07118 |
-0,23584 |
-0,900271 |
C_7 |
-0,10114 |
-1,22977 |
-0,879086 |
-0,078025 |
-0,67583 |
0,62264 |
0,191757 |
C_10 |
0,21006 |
-1,47485 |
-0,873666 |
-0,525944 |
-0,54296 |
1,84328 |
-0,236876 |
C_12 |
-1,97947 |
-2,27916 |
-0,664577 |
-0,894394 |
0,37821 |
2,38603 |
2,955986 |
Як видно з перевпорядкованої матриці, саме 5 фактор, тобто розмір дебіторської заборгованості, є визначальним у проведенні кластерного аналізу. Крім того, наступними за значимістю факторами є собівартість одиниці продукції – 6 фактор.
Визначивши, які фактори є визначальними у проведенні кластерного аналізу, визначимо залежність усіх факторів між собою. Для цього проведемо факторний аналіз, використовуючи опції «Многомерный разведывательный анализ» Статистики. (Таблиця 7) Головними цілями факторного аналізу є: (1) скорочення числа змінних (редукція даних) і (2) визначення структури взаємозв'язків між змінними, тобто класифікація змінних.
Таблиця 7