Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Документ Microsoft Word.doc
Скачиваний:
5
Добавлен:
28.02.2016
Размер:
927.74 Кб
Скачать

Результати кластеризації методом k-середніх

Таблица данных1

z1

z2

z3

z4

z5

z6

z7

НАБЛ_НО

КЛАСТЕР

РАССТ.

C_1

2,45516335

0,720977022

-0,263874537

-0,353375982

0,387998175

-0,926786393

-0,655985513

1

2

0,92

C_2

0,687979226

0,378855606

-0,479256886

-0,83957792

-0,519099456

0,742396565

0,283200794

2

2

0,52

C_3

-0,823574486

0,762097384

-0,511815152

0,691939953

-0,0798131815

2,07118103

0,138710593

3

1

0,82

C_4

-0,29008494

0,523599282

-0,762519737

0,059395707

-0,122600806

-0,404787359

0,9334067

4

2

0,48

C_5

0,0544603911

-0,494540892

0,690261871

-0,532648477

-0,549906545

0,556165408

1,3668773

5

2

0,84

C_6

-0,995847151

0,98743697

-0,20804331

1,11301542

-0,0798131815

-0,926786393

-0,00577960805

6

2

0,79

C_7

-0,101140726

-1,22977297

0,622635122

0,191756868

-0,879086

-0,675825319

-0,0780247086

7

3

0,58

C_8

0,565721205

0,336090429

-0,235841717

-0,900270715

2,1537008

2,07118103

-0,655985513

8

1

0,78

C_9

0,265633336

0,526888911

-0,748403313

-0,460752524

0,154092497

-0,675825319

-0,648761003

9

2

0,34

C_10

0,210061508

-1,47485033

1,84327659

-0,2368763

-0,873666234

-0,542963574

-0,525944332

10

3

0,57

C_11

-0,55127253

-0,361310918

-0,300294408

0,158457382

-0,804635534

-0,260971298

-0,930516896

11

2

0,59

C_12

-1,9794685

-2,27916462

2,38602481

2,95598553

-0,664577378

0,378211192

-0,894394345

12

3

1,03

C_13

0,943609633

-0,246173903

-0,0094769045

-0,929048975

-0,524519221

-1,04542254

-0,164718829

13

2

0,53

C_14

-0,429014509

0,716042578

-0,779502434

-0,425137175

2,38475397

-0,404787359

2,68173813

14

1

1,04

C_15

-0,0122258021

1,13382546

-1,24316999

-0,492862789

0,0171720998

0,0450203195

-0,843822775

15

2

0,57

Отже, метод кластеризації k-середніх розподілив підприємства, помістивши їх в кожний кластер відповідно їх значенням. До 1 кластеру потрапили 3 підприємства, а саме: 3, 8, 14. До 2 кластеру потрапили 8 підприємств: 1, 2, 4, 5, 6, 9, 13, 15. До 3 кластеру потрапили 3 підприємства: 7, 10, 12.

Для визначення чи правильно проведена кластеризація і стійкість розбиття на кластери використаємо Дискримінантний метод на основі апостріорних імовірностей (отриманими на основі досвіду про розподіл) (таблиця 5).

Таблиця 5

Результати Дискримінантного методу на основі апостеріорних імовірностей

Апостериорные вероятности (Таблица данных1) Неправильные классификации отмечены *

Наблюд.

G_1:1

G_2:2

G_3:3

1

G_2:2

0,000000

0,999989

0,000010

2

G_2:2

0,000151

0,999848

0,000000

3

G_1:1

0,987944

0,012056

0,000000

4

G_2:2

0,000041

0,999958

0,000001

5

G_2:2

0,000042

0,998952

0,001006

6

G_2:2

0,000000

0,999984

0,000016

7

G_3:3

0,000000

0,042129

0,957871

8

G_1:1

1,000000

0,000000

0,000000

9

G_2:2

0,000001

0,999984

0,000014

10

G_3:3

0,000000

0,000347

0,999653

11

G_2:2

0,000000

0,984280

0,015720

12

G_3:3

0,000000

0,000001

0,999999

13

G_2:2

0,000000

0,985446

0,014554

14

G_1:1

0,999997

0,000003

0,000000

15

G_2:2

0,000130

0,999870

0,000000

Неправильні результати класифікації можуть біти відмічені «*», але оскільки вони відсутні, це може свідчити про правильність проведення кластеризації. За даними таблиці 5 отримуємо:

8 підприємство потрапило у 1 кластер з ймовірністю 1,0 тобто достовірно, з незначним відхиленням до 1 кластеру також потрапляють підприємство 14 з ймовірністю о,99 та підприємство з ймовірністю 0,98.

1,2,4, 5, 6,9, 15,11 підприємство потрапили у 2 кластер з ймовірністю 0,99, та підприємство 13 з ймовірністю 0,98;

Всі інші підприємства потрапили у 3 кластер з ймовірністю 0,99.

Отже, розподіл підприємств за латентною ознакою «Інвестиційна привабливість» на кластери здійснено абсолютно достовірно.

Рис. 3. Аналіз впливу факторів на включення підприємства у кластер

Отримали діаграму, кольором показується, яка змінна більш всього впливає на підприємство і на включення його до певного кластеру. Це додатково характеризує ступінь впливу фактора на потрапляння підприємства до кластеру та на формування кластеру.

Отже, наприклад, за результатами аналізу, бачимо, що на віднесення 3 і 8 підприємства до кластеру більше всього вплинув фактор собівартості одиниці продукції – z6, на віднесення 1 підприємства до кластера більше всього вплинув фактор середньорічної вартості ОПФ – z1. На віднесення підприємства 12 до кластеру найбільше вплинув фактор кредиторської заборгованості z7

Для отримання більш повної характеристики отриманих кластерів, необхідно використовувати ще одну операцію багатовимірної класифікації - метод подвійного об'єднання. Цей метод полягає в одночасній угрупованню як спостережень (підприємств), так і змінних (факторів). Ключове місце в алгоритмі займає бар'єрне значення параметра подвійного об'єднання, яке визначає, коли метод враховує одночасну близькість в обох характеристиках досліджуваної сукупності. Для проведення аналізу необхідно побудувати перевпорядковану матрицю, використавши модулі Статистики «Двухвходовое объединение». (Таблиця 6)

Таблиця 6

Результати двухвходового об’нання (Перевпорядкована матриця)

Переупорядоч.матрица (Таблица данных1)

z1

z2

z5

z7

z6

z3

z4

C_1

2,45516

0,72098

0,387998

-0,655986

-0,92679

-0,26387

-0,353376

C_9

0,26563

0,52689

0,154092

-0,648761

-0,67583

-0,74840

-0,460753

C_15

-0,01223

1,13383

0,017172

-0,843823

0,04502

-1,24317

-0,492863

C_2

0,68798

0,37886

-0,519100

0,283201

0,74240

-0,47926

-0,839578

C_13

0,94361

-0,24617

-0,524519

-0,164719

-1,04542

-0,00948

-0,929049

C_5

0,05446

-0,49454

-0,549907

1,366877

0,55617

0,69026

-0,532648

C_3

-0,82357

0,76210

-0,079813

0,138711

2,07118

-0,51182

0,691940

C_6

-0,99585

0,98744

-0,079813

-0,005780

-0,92679

-0,20804

1,113015

C_4

-0,29008

0,52360

-0,122601

0,933407

-0,40479

-0,76252

0,059396

C_11

-0,55127

-0,36131

-0,804635

-0,930517

-0,26097

-0,30029

0,158457

C_14

-0,42901

0,71604

2,384754

2,681738

-0,40479

-0,77950

-0,425137

C_8

0,56572

0,33609

2,153701

-0,655986

2,07118

-0,23584

-0,900271

C_7

-0,10114

-1,22977

-0,879086

-0,078025

-0,67583

0,62264

0,191757

C_10

0,21006

-1,47485

-0,873666

-0,525944

-0,54296

1,84328

-0,236876

C_12

-1,97947

-2,27916

-0,664577

-0,894394

0,37821

2,38603

2,955986

Як видно з перевпорядкованої матриці, саме 5 фактор, тобто розмір дебіторської заборгованості, є визначальним у проведенні кластерного аналізу. Крім того, наступними за значимістю факторами є собівартість одиниці продукції – 6 фактор.

Визначивши, які фактори є визначальними у проведенні кластерного аналізу, визначимо залежність усіх факторів між собою. Для цього проведемо факторний аналіз, використовуючи опції «Многомерный разведывательный анализ» Статистики. (Таблиця 7) Головними цілями факторного аналізу є: (1) скорочення числа змінних (редукція даних) і (2) визначення структури взаємозв'язків між змінними, тобто класифікація змінних.

Таблиця 7