- •Оглавление
- •Постановка задачи
- •Глава 1. «Компонентный анализ»
- •§1. «Проверка гипотезы: сколько факторов следует выделять?»
- •§2. «Интерпретация факторов (главных компонент)»
- •§3. «Построение диаграммы рассеивания»
- •§4. «Построение уравнения регрессии на главных компонентах»
- •Глава 2. «Кластерный анализ»
- •§1. «Построение и анализ дендрограмм»
- •§2. «Использование метода k-средних для классификации объектов»
- •§3. «Создание таблицы «состав кластеров»
- •§4. «Описание кластеров с помощью графических средств»
- •Глава3. «Дискриминантный анализ»
- •§1. «Уточнение результатов классификации»
- •§2. «Построение дискриминантной функции с помощью включения всех переменных»
- •2.1. Исследование качества классификации
- •2.2. Построение дискриминантной функции
- •2.3. Графический анализ результатов классификации
- •§3. «Построение дискриминантной функции с помощью пошагового алгоритма»
- •Заключение
- •Список литературы
- •Приложения
Заключение
В ходе компонентного анализа нами была построена факторная модель, первая главная компонента Z1 которой имеет высокие положительные корреляции с числом предприятий и организаций (x1), числом зарегистрированных преступлений в сфере экономики (x2) и внутренними затратами на научные исследования и разработки (x5) в регионе России. Вторая главная компонента Z2 имеет высокую положительную факторную нагрузку с просроченной задолженностью по заработной плате (x3) в регионе и отрицательную связь средней тесноты с индексами цен производителей промышленных товаров (x4) в регионе. Таким образом, выдвинутая ранее гипотеза Н1 нашла подтверждение в ходе анализа.
Кластерный анализ позволил выявить, что наиболее устойчивым и, следовательно, предпочтительным, является разбиение на два кластера: высокоразвитые субъекты Российской Федерации, куда вошло 12 наблюдений, и регионы России, характеризующиеся более низким уровнем экономического развития, с числом единиц анализа, равным 32.
Дискриминантный анализ позволил заключить, что только одно наблюдение было некорректно классифицировано в процессе кластерного анализа: Иркутская область была ошибочно отнесена к первому кластеру. Кроме того, нам удалось построить дискриминантные функции методом включения всех переменных и с помощью пошагового алгоритма. Подставив в них новые наблюдения, подлежащие классификации,
мы определили, что г. Москва и Нижегородская область относятся к субъектам Российской Федерации с высоким уровнем экономического развития, тогда как Сахалинская была отнесена нами ко второму кластеру.
Список литературы
1) Дубров А.М., Мхитарян В.С., Трошин Л.И. «Многомерные статистические методы для экономистов и менеджеров»/Учебник – Финансы и статистика, Москва, 2003 г.
2) Крыштановский А.О. «Анализ социологических данных с помощью пакета SPSS» – Издательский дом ГУ-ВШЭ, Москва, 2006 г.
Приложения
Таблица 1 «Протокол объединения объектов с использованием
метода внутригрупповых связей»
Шаги агломерации |
||||||
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
|||
1 |
29 |
42 |
,003 |
0 |
0 |
9 |
2 |
17 |
32 |
,008 |
0 |
0 |
4 |
3 |
5 |
7 |
,011 |
0 |
0 |
6 |
4 |
17 |
34 |
,012 |
2 |
0 |
11 |
5 |
2 |
10 |
,014 |
0 |
0 |
7 |
6 |
1 |
5 |
,018 |
0 |
3 |
8 |
7 |
2 |
15 |
,019 |
5 |
0 |
15 |
8 |
1 |
6 |
,021 |
6 |
0 |
10 |
9 |
11 |
29 |
,025 |
0 |
1 |
16 |
10 |
1 |
14 |
,026 |
8 |
0 |
12 |
11 |
8 |
17 |
,028 |
0 |
4 |
17 |
12 |
1 |
9 |
,034 |
10 |
0 |
16 |
13 |
12 |
44 |
,035 |
0 |
0 |
26 |
14 |
22 |
33 |
,036 |
0 |
0 |
30 |
15 |
2 |
3 |
,036 |
7 |
0 |
20 |
16 |
1 |
11 |
,039 |
12 |
9 |
18 |
17 |
8 |
16 |
,043 |
11 |
0 |
22 |
18 |
1 |
36 |
,053 |
16 |
0 |
22 |
19 |
21 |
31 |
,057 |
0 |
0 |
29 |
20 |
2 |
43 |
,059 |
15 |
0 |
25 |
21 |
28 |
40 |
,062 |
0 |
0 |
29 |
22 |
1 |
8 |
,067 |
18 |
17 |
23 |
23 |
1 |
18 |
,080 |
22 |
0 |
26 |
24 |
23 |
24 |
,082 |
0 |
0 |
33 |
25 |
2 |
4 |
,088 |
20 |
0 |
31 |
26 |
1 |
12 |
,096 |
23 |
13 |
28 |
27 |
25 |
26 |
,118 |
0 |
0 |
32 |
28 |
1 |
39 |
,121 |
26 |
0 |
32 |
29 |
21 |
28 |
,126 |
19 |
21 |
35 |
30 |
19 |
22 |
,136 |
0 |
14 |
39 |
31 |
2 |
41 |
,145 |
25 |
0 |
35 |
32 |
1 |
25 |
,157 |
28 |
27 |
36 |
33 |
23 |
37 |
,161 |
24 |
0 |
39 |
34 |
27 |
38 |
,163 |
0 |
0 |
42 |
35 |
2 |
21 |
,195 |
31 |
29 |
37 |
36 |
1 |
13 |
,210 |
32 |
0 |
38 |
37 |
2 |
20 |
,256 |
35 |
0 |
40 |
38 |
1 |
35 |
,263 |
36 |
0 |
40 |
39 |
19 |
23 |
,265 |
30 |
33 |
41 |
40 |
1 |
2 |
,322 |
38 |
37 |
42 |
41 |
19 |
30 |
,346 |
39 |
0 |
43 |
42 |
1 |
27 |
,363 |
40 |
34 |
43 |
43 |
1 |
19 |
,552 |
42 |
41 |
0 |
Рисунок 1 «Дендрограмма с использованием метода внутригрупповых связей»
Таблица 2 «Протокол объединения объектов с использованием
метода ближайшего соседа»
Шаги агломерации |
||||||
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
|||
1 |
29 |
42 |
,003 |
0 |
0 |
10 |
2 |
17 |
32 |
,008 |
0 |
0 |
4 |
3 |
5 |
7 |
,011 |
0 |
0 |
6 |
4 |
17 |
34 |
,012 |
2 |
0 |
12 |
5 |
2 |
10 |
,014 |
0 |
0 |
8 |
6 |
5 |
16 |
,015 |
3 |
0 |
7 |
7 |
1 |
5 |
,017 |
0 |
6 |
11 |
8 |
2 |
11 |
,019 |
5 |
0 |
9 |
9 |
2 |
15 |
,019 |
8 |
0 |
10 |
10 |
2 |
29 |
,020 |
9 |
1 |
13 |
11 |
1 |
6 |
,020 |
7 |
0 |
12 |
12 |
1 |
17 |
,022 |
11 |
4 |
13 |
13 |
1 |
2 |
,023 |
12 |
10 |
14 |
14 |
1 |
14 |
,023 |
13 |
0 |
15 |
15 |
1 |
8 |
,029 |
14 |
0 |
16 |
16 |
1 |
3 |
,029 |
15 |
0 |
17 |
17 |
1 |
9 |
,033 |
16 |
0 |
20 |
18 |
12 |
44 |
,035 |
0 |
0 |
26 |
19 |
22 |
33 |
,036 |
0 |
0 |
34 |
20 |
1 |
43 |
,045 |
17 |
0 |
22 |
21 |
21 |
31 |
,057 |
0 |
0 |
27 |
22 |
1 |
36 |
,059 |
20 |
0 |
23 |
23 |
1 |
18 |
,060 |
22 |
0 |
25 |
24 |
28 |
40 |
,062 |
0 |
0 |
30 |
25 |
1 |
26 |
,063 |
23 |
0 |
26 |
26 |
1 |
12 |
,065 |
25 |
18 |
27 |
27 |
1 |
21 |
,079 |
26 |
21 |
29 |
28 |
23 |
24 |
,082 |
0 |
0 |
40 |
29 |
1 |
4 |
,094 |
27 |
0 |
30 |
30 |
1 |
28 |
,103 |
29 |
24 |
31 |
31 |
1 |
25 |
,118 |
30 |
0 |
32 |
32 |
1 |
20 |
,119 |
31 |
0 |
33 |
33 |
1 |
41 |
,135 |
32 |
0 |
34 |
34 |
1 |
22 |
,135 |
33 |
19 |
36 |
35 |
38 |
39 |
,138 |
0 |
0 |
36 |
36 |
1 |
38 |
,142 |
34 |
35 |
37 |
37 |
1 |
37 |
,154 |
36 |
0 |
38 |
38 |
1 |
19 |
,160 |
37 |
0 |
39 |
39 |
1 |
27 |
,163 |
38 |
0 |
40 |
40 |
1 |
23 |
,198 |
39 |
28 |
41 |
41 |
1 |
35 |
,200 |
40 |
0 |
42 |
42 |
1 |
13 |
,299 |
41 |
0 |
43 |
43 |
1 |
30 |
,368 |
42 |
0 |
0 |
Рисунок 2 «Дендрограмма с использованием метода ближайшего соседа»
Таблица 3 «Протокол объединения объектов с использованием
метода дальнего соседа»
Шаги агломерации |
||||||
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
|||
1 |
29 |
42 |
,003 |
0 |
0 |
11 |
2 |
17 |
32 |
,008 |
0 |
0 |
5 |
3 |
5 |
7 |
,011 |
0 |
0 |
8 |
4 |
2 |
10 |
,014 |
0 |
0 |
7 |
5 |
17 |
34 |
,016 |
2 |
0 |
17 |
6 |
6 |
14 |
,023 |
0 |
0 |
12 |
7 |
2 |
15 |
,024 |
4 |
0 |
23 |
8 |
1 |
5 |
,027 |
0 |
3 |
12 |
9 |
12 |
44 |
,035 |
0 |
0 |
25 |
10 |
22 |
33 |
,036 |
0 |
0 |
29 |
11 |
9 |
29 |
,039 |
0 |
1 |
18 |
12 |
1 |
6 |
,043 |
8 |
6 |
19 |
13 |
3 |
43 |
,045 |
0 |
0 |
23 |
14 |
21 |
31 |
,057 |
0 |
0 |
26 |
15 |
16 |
36 |
,059 |
0 |
0 |
20 |
16 |
28 |
40 |
,062 |
0 |
0 |
26 |
17 |
8 |
17 |
,062 |
0 |
5 |
25 |
18 |
9 |
11 |
,065 |
11 |
0 |
19 |
19 |
1 |
9 |
,076 |
12 |
18 |
30 |
20 |
16 |
18 |
,081 |
15 |
0 |
30 |
21 |
23 |
24 |
,082 |
0 |
0 |
28 |
22 |
25 |
26 |
,118 |
0 |
0 |
31 |
23 |
2 |
3 |
,130 |
7 |
13 |
27 |
24 |
38 |
39 |
,138 |
0 |
0 |
31 |
25 |
8 |
12 |
,164 |
17 |
9 |
33 |
26 |
21 |
28 |
,193 |
14 |
16 |
36 |
27 |
2 |
4 |
,202 |
23 |
0 |
38 |
28 |
23 |
37 |
,204 |
21 |
0 |
37 |
29 |
19 |
22 |
,214 |
0 |
10 |
37 |
30 |
1 |
16 |
,237 |
19 |
20 |
33 |
31 |
25 |
38 |
,242 |
22 |
24 |
34 |
32 |
13 |
41 |
,299 |
0 |
0 |
40 |
33 |
1 |
8 |
,331 |
30 |
25 |
38 |
34 |
25 |
35 |
,399 |
31 |
0 |
41 |
35 |
27 |
30 |
,444 |
0 |
0 |
42 |
36 |
20 |
21 |
,474 |
0 |
26 |
39 |
37 |
19 |
23 |
,504 |
29 |
28 |
39 |
38 |
1 |
2 |
,574 |
33 |
27 |
40 |
39 |
19 |
20 |
,934 |
37 |
36 |
42 |
40 |
1 |
13 |
,967 |
38 |
32 |
41 |
41 |
1 |
25 |
1,491 |
40 |
34 |
43 |
42 |
19 |
27 |
1,623 |
39 |
35 |
43 |
43 |
1 |
19 |
2,629 |
41 |
42 |
0 |
Рисунок 3 «Дендрограмма с использованием метода дальнего соседа»
Таблица 4 «Протокол объединения объектов с использованием
метода Варда»
Шаги агломерации |
||||||
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
|||
1 |
29 |
42 |
,002 |
0 |
0 |
13 |
2 |
17 |
32 |
,006 |
0 |
0 |
5 |
3 |
5 |
7 |
,011 |
0 |
0 |
8 |
4 |
2 |
10 |
,018 |
0 |
0 |
7 |
5 |
17 |
34 |
,026 |
2 |
0 |
17 |
6 |
6 |
14 |
,038 |
0 |
0 |
11 |
7 |
2 |
15 |
,050 |
4 |
0 |
24 |
8 |
1 |
5 |
,063 |
0 |
3 |
11 |
9 |
12 |
44 |
,080 |
0 |
0 |
27 |
10 |
22 |
33 |
,098 |
0 |
0 |
28 |
11 |
1 |
6 |
,120 |
8 |
6 |
21 |
12 |
3 |
43 |
,142 |
0 |
0 |
24 |
13 |
11 |
29 |
,165 |
0 |
1 |
15 |
14 |
21 |
31 |
,194 |
0 |
0 |
26 |
15 |
9 |
11 |
,222 |
0 |
13 |
21 |
16 |
16 |
36 |
,252 |
0 |
0 |
19 |
17 |
8 |
17 |
,282 |
0 |
5 |
27 |
18 |
28 |
40 |
,313 |
0 |
0 |
31 |
19 |
16 |
18 |
,350 |
16 |
0 |
30 |
20 |
23 |
24 |
,391 |
0 |
0 |
29 |
21 |
1 |
9 |
,443 |
11 |
15 |
33 |
22 |
25 |
26 |
,502 |
0 |
0 |
30 |
23 |
38 |
39 |
,571 |
0 |
0 |
32 |
24 |
2 |
3 |
,648 |
7 |
12 |
25 |
25 |
2 |
4 |
,748 |
24 |
0 |
39 |
26 |
20 |
21 |
,853 |
0 |
14 |
38 |
27 |
8 |
12 |
,963 |
17 |
9 |
33 |
28 |
19 |
22 |
1,082 |
0 |
10 |
36 |
29 |
23 |
37 |
1,202 |
20 |
0 |
36 |
30 |
16 |
25 |
1,327 |
19 |
22 |
37 |
31 |
28 |
41 |
1,452 |
18 |
0 |
34 |
32 |
35 |
38 |
1,615 |
0 |
23 |
37 |
33 |
1 |
8 |
1,832 |
21 |
27 |
39 |
34 |
13 |
28 |
2,053 |
0 |
31 |
41 |
35 |
27 |
30 |
2,275 |
0 |
0 |
40 |
36 |
19 |
23 |
2,638 |
28 |
29 |
38 |
37 |
16 |
35 |
3,053 |
30 |
32 |
42 |
38 |
19 |
20 |
3,540 |
36 |
26 |
40 |
39 |
1 |
2 |
4,175 |
33 |
25 |
41 |
40 |
19 |
27 |
5,025 |
38 |
35 |
43 |
41 |
1 |
13 |
5,934 |
39 |
34 |
42 |
42 |
1 |
16 |
7,148 |
41 |
37 |
43 |
43 |
1 |
19 |
11,876 |
42 |
40 |
0 |
Рисунок 4 «Дендрограмма с использованием метода Варда»
Таблица 5 «Квадрат расстояний Махаланобиса до центра групп и апостериорные вероятности классификации»
Поточечные статистики |
||||||||
Номер наблюдения |
Фактическая группа |
Наивероятнейшая группа |
Вторая вероятнейшая группа |
|||||
Предсказанная группа |
P(G=g | D=d) |
Квадрат расстояния Махалонобиса до центра |
Группа |
P(G=g | D=d) |
Квадрат расстояния Махалонобиса до центра |
|||
Исходные |
1 |
2 |
2 |
,999 |
,030 |
1 |
,001 |
13,993 |
2 |
2 |
2 |
,997 |
,189 |
1 |
,003 |
12,096 |
|
3 |
2 |
2 |
,975 |
1,040 |
1 |
,025 |
8,369 |
|
4 |
2 |
2 |
,995 |
,343 |
1 |
,005 |
11,073 |
|
5 |
2 |
2 |
1,000 |
,556 |
1 |
,000 |
21,702 |
|
6 |
2 |
2 |
1,000 |
,125 |
1 |
,000 |
18,208 |
|
7 |
2 |
2 |
1,000 |
,177 |
1 |
,000 |
18,779 |
|
8 |
2 |
2 |
1,000 |
,707 |
1 |
,000 |
22,599 |
|
9 |
2 |
2 |
,997 |
,216 |
1 |
,003 |
11,889 |
|
10 |
2 |
2 |
,996 |
,280 |
1 |
,004 |
11,449 |
|
11 |
2 |
2 |
,999 |
,014 |
1 |
,001 |
14,399 |
|
12 |
2 |
2 |
1,000 |
,604 |
1 |
,000 |
21,997 |
|
13 |
2 |
2 |
1,000 |
,417 |
1 |
,000 |
20,783 |
|
14 |
2 |
2 |
,999 |
,013 |
1 |
,001 |
14,420 |
|
15 |
2 |
2 |
,984 |
,821 |
1 |
,016 |
9,041 |
|
16 |
2 |
2 |
1,000 |
1,400 |
1 |
,000 |
25,970 |
|
17 |
2 |
2 |
1,000 |
1,637 |
1 |
,000 |
26,962 |
|
18 |
2 |
2 |
1,000 |
,472 |
1 |
,000 |
21,160 |
|
19 |
1 |
1 |
1,000 |
,865 |
2 |
,000 |
23,453 |
|
20 |
1 |
1 |
1,000 |
,045 |
2 |
,000 |
17,014 |
|
21 |
1 |
1 |
,980 |
,932 |
2 |
,020 |
8,686 |
|
22 |
1 |
1 |
1,000 |
,003 |
2 |
,000 |
15,706 |
|
23 |
1 |
1 |
1,000 |
,253 |
2 |
,000 |
19,500 |
|
24 |
1 |
1 |
1,000 |
2,427 |
2 |
,000 |
29,928 |
|
25 |
2 |
2 |
,998 |
,109 |
1 |
,002 |
12,831 |
|
26 |
2 |
2 |
1,000 |
,011 |
1 |
,000 |
16,141 |
|
27 |
1 |
1 |
,992 |
,515 |
2 |
,008 |
10,210 |
|
28 |
2 |
2 |
,988 |
,682 |
1 |
,012 |
9,529 |
|
29 |
2 |
2 |
1,000 |
,024 |
1 |
,000 |
16,559 |
|
30 |
1 |
1 |
1,000 |
3,736 |
2 |
,000 |
34,172 |
|
31 |
2 |
2 |
,575 |
3,529 |
1 |
,425 |
4,138 |
|
32 |
2 |
2 |
1,000 |
,853 |
1 |
,000 |
23,389 |
|
33 |
1 |
1 |
1,000 |
,552 |
2 |
,000 |
21,674 |
|
34 |
2 |
2 |
1,000 |
2,554 |
1 |
,000 |
30,372 |
|
35 |
2 |
2 |
,993 |
,465 |
1 |
,007 |
10,441 |
|
36 |
2 |
2 |
1,000 |
,237 |
1 |
,000 |
19,361 |
|
37 |
1 |
1 |
,997 |
,226 |
2 |
,003 |
11,816 |
|
38 |
1 |
2** |
,525 |
3,727 |
1 |
,475 |
3,929 |
|
39 |
2 |
2 |
,664 |
3,177 |
1 |
,336 |
4,539 |
|
40 |
2 |
2 |
,856 |
2,251 |
1 |
,144 |
5,821 |
|
41 |
2 |
2 |
,996 |
,330 |
1 |
,004 |
11,145 |
|
42 |
2 |
2 |
1,000 |
,101 |
1 |
,000 |
17,895 |
|
43 |
1 |
1 |
,659 |
3,195 |
2 |
,341 |
4,517 |
|
44 |
2 |
2 |
1,000 |
1,956 |
1 |
,000 |
28,211 |
|
**. Неправильно классифицированное наблюдение |