Компьютерный практикум по статистике
.pdfКластеризовать
|
|
|
|
|
|
|
|
|
Сводка обработки наблюденийa |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
Наблюдения |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
Валидные |
|
|
Пропущенные |
|
|
Всего |
|
|
|
|
|
||||||||
|
|
|
|
|
N |
Процент |
N |
|
Процент |
|
N |
|
|
Процент |
|
|
|
|
|
|||||
|
|
|
|
|
20 |
|
|
100,0 |
0 |
|
0,0 |
|
|
20 |
|
100,0 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
a. Метод единичных связей |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
Матрица близости |
|
|
|
|
|
|
|
|
|
|||||
Наблюдения |
|
|
|
|
|
|
|
|
Евклидовы расстояния |
|
|
|
|
|
|
|
|
|||||||
|
|
1:Австралия |
|
|
2:Австрия |
|
|
3:Беларусь |
|
|
4:Бразилия |
|
… |
20:ЮАР |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
1:Австралия |
|
|
|
|
|
|
|
|
1,066 |
|
|
1,372 |
|
|
|
2,157 |
|
|
… |
3,124 |
||||
2:Австрия |
|
|
|
|
1,066 |
|
|
|
|
|
|
|
1,543 |
|
|
|
2,562 |
|
|
… |
3,522 |
|||
3:Беларусь |
|
|
|
1,372 |
|
|
|
|
1,543 |
|
|
|
|
|
|
|
|
1,425 |
|
|
… |
2,761 |
||
4:Бразилия |
|
|
|
2,157 |
|
|
|
|
2,562 |
|
|
1,425 |
|
|
|
|
|
|
… |
1,602 |
||||
… |
|
|
|
|
… |
|
|
|
|
… |
|
|
|
… |
|
|
|
… |
|
|
|
… |
||
20:ЮАР |
|
|
|
|
3,124 |
|
|
|
|
3,522 |
|
|
2,761 |
|
|
|
1,60 |
|
|
… |
|
|||
|
|
|
|
|
|
|
|
|
|
Это матрица различий. |
|
|
|
|
|
|
|
|
|
|||||
Метод единичных связей |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
Шаги агломерации |
|
|
|
|
|
|
|
|
|
|||||
Этап |
Кластер объединен с |
|
|
Коэффициенты |
|
|
Этап первого появления кластера |
|
Следующий |
|||||||||||||||
|
Кластер 1 |
Кластер 2 |
|
|
|
|
|
|
|
Кластер 1 |
|
|
|
Кластер 2 |
|
|
этап |
|||||||
1 |
|
6 |
|
18 |
|
|
|
|
0,134 |
|
|
|
0 |
|
|
|
0 |
|
|
|
|
16 |
||
2 |
|
5 |
|
7 |
|
|
|
|
0,360 |
|
|
|
0 |
|
|
|
0 |
|
|
|
|
4 |
||
3 |
|
1 |
|
11 |
|
|
|
|
0,418 |
|
|
|
0 |
|
|
|
0 |
|
|
|
|
7 |
||
4 |
|
5 |
|
10 |
|
|
|
|
0,443 |
|
|
|
2 |
|
|
|
0 |
|
|
|
|
10 |
||
5 |
|
3 |
|
15 |
|
|
|
|
0,443 |
|
|
|
0 |
|
|
|
0 |
|
|
|
|
8 |
||
… |
|
… |
… |
|
|
|
|
… |
|
|
… |
|
|
|
… |
|
|
… |
||||||
19 |
|
1 |
|
19 |
|
|
|
|
2,573 |
|
|
|
18 |
|
|
|
0 |
|
|
|
|
0 |
Дендрограмма с использованием метода ближайшего соседа Объединение кластеров по масштабируемому расстоянию
Рис. 3.7.7. Результаты работы программы «Иерархический кластерный анализ» с объединением по методу ближнего соседа
81
К этой матрице вновь применяются описанные операции и так до тех пор, пока все объекты не будут объединены в один кластер.
в) Появившаяся в окне ввода исходных данных новая переменная «CLU2_1» содержит информацию о принадлежности стран к кластерам. Все
страны, кроме Эфиопии, вошли в первый кластер, а Эфиопия — во второй. Такое разбиение представляется бесполезным.
3. Для реализации иерархического кластерного анализа этих же стран с объединением кластеров по методам дальнего соседа и средней связи обратимся (с помощью выбора пункта меню «Анализ | Классификация | Иерархическая кластеризация…») к программе «Иерархический кластерный анализ» (рис. 3.7.2), выбрав в качестве классификационных признаков стандартизованные признаки z(1), z(2), z(3), z(4), z(5).
В окне ввода параметров метода иерархического кластерного анализа, вызываемом нажатием кнопки «Метод…» (рис. 3.7.3), укажем, что необходимо использовать метод дальнего соседа и, соответственно, метод средней связи (в терминологии PASW Statistics — «Метод: Межгрупповые связи»), а
остальные параметры оставим такими же, как и при выполнении п. 1. Дендрограммы, полученные в результате иерархического кластерного
анализа стран с объединением кластеров по методам дальнего соседа и средней связи, представлены на рис. 3.7.8 и 3.7.9.
Судя по дендрограмме, полученной в результате иерархического кластерного анализа стран с объединением кластеров по методу дальнего соседа, исходную совокупность стран имеет смысл разбить на два кластера:
∙в первый кластер вошли Австралия, Австрия, Беларусь, Бразилия, Великобритания, Германия, Италия, Канада, Китай, Мексика, Польша, Россия, США и Украина;
∙во второй кластер вошли Вьетнам, Замбия, Индия, Филиппины, Эфиопия и ЮАР.
Эта информация содержится в новой переменной «CLU2_2», появив-
шейся в окне ввода исходных данных.
Судя по дендрограмме, полученной в результате иерархического кластерного анализа стран с объединением кластеров по методу средней связи, исходную совокупность стран имеет смысл разбить на два кластера:
∙в первый кластер вошли Австралия, Австрия, Беларусь, Бразилия, Великобритания, Вьетнам, Германия, Италия, Канада, Китай, Мексика, Польша, Россия, США, Украина, Филиппины и ЮАР;
∙во второй кластер вошли Замбия, Индия и Эфиопия.
Эта информация содержится в новой переменной «CLU2_3», появив-
шейся в окне ввода исходных данных.
4. Для реализации кластерного анализа этих же стран по методу K- средних обратимся (с помощью выбора пункта меню « Анализ | Классификация | Кластеризация K-средними…») к программе «Кластерный анализ методом K- средних» (рис. 3.7.10), выбрав в качестве классификационных признаков стандартизованные признаки z(1), z(2), z(3), z(4), z(5) и указать в качестве количества кластеров («Число кластеров») число 2. Укажем, что в результатах работы программы нужно обозначать их с помощью названий («Метить наблюдения: Страна»).
82
Дендрограмма с использованием метода дальнего соседа Объединение кластеров по масштабируемому расстоянию
Рис. 3.7.8. Дендрограмма, полученная в результате иерархического кластерного анализа с объединением по методу дальнего соседа
Дендрограмма с использованием метода межгрупповых связей Объединение кластеров по масштабируемому расстоянию
Рис. 3.7.9. Дендрограмма, полученная в результате иерархического кластерного анализа с объединением по методу средней связи
83
Рис. 3.7.10. Окно ввода данных программы «Кластерный анализ методом K-средних»
В окне «Кластерный анализ методом K-средних: Параметры», вызываемом нажатием кнопки «Параметры…» (рис. 3.7.11), укажем, что необходимо вывести в отчете начальные центры кластеров и информацию о конечном кластере для каждого наблюдения.
Рис. 3.7.11. Окно «Кластерный анализ методом K-средних: Параметры»
В окне ввода параметров сохранения результатов кластерного анализа по методу K-средних, вызываемом нажатием кнопки «Сохранить…»
84
(рис. 3.7.12), укажем, что необходимо сохранить в качестве новой переменной принадлежность стран к кластерам, отметив флажок «Принадлежность к кластеру».
Рис. 3.7.12. Окно «Кластерный анализ методом K-средних: Сохранить»
В результате работы программы (рис. 3.7.13) получено разбиение исходной совокупности стран на два кластера:
∙в первый кластер вошли Замбия, Индия, Эфиопия и ЮАР;
∙во второй кластер вошли Австралия, Австрия, Беларусь, Бразилия, Великобритания, Вьетнам, Германия, Италия, Канада, Китай, Мексика, Польша, Россия, США, Украина и Филиппины.
Эта информация содержится в новой переменной «QCL_1», появив-
шейся в окне ввода исходных данных.
5. В результате иерархического кластерного анализа стран с объединением по методу ближнего соседа с выбором в качестве классификационных признаков двух главных компонент, сохраненных при выполнении работы 6, получено разбиение исходной совокупности стран на два кластера: все страны, кроме Эфиопии, вошли в первый кластер, а Эфиопия — во второй (эта информация содержится в новой переменной «CLU2_4», поя-
вившейся в окне ввода исходных данных).
Такое разбиение представляется бесполезным (точно такое же разбиение было нами получено в результате иерархического кластерного анализа тех же стран с объединением по методу ближнего соседа с выбором в качестве классификационных признаков стандартизованных исходных признаков).
Врезультате иерархического кластерного анализа стран с объединением по методу дальнего соседа и по методу средней связи с выбором в качестве классификационных признаков двух главных компонент получено разбиение исходной совокупности стран на два кластера: в первый кластер вошли все страны, кроме Замбии и Эфиопии, а во второй кластер — Замбия и Эфиопия. Такое разбиение представляется нам также бесполезным.
Врезультате кластерного анализа стран по методу K-средних с выбо-
ром в качестве классификационных признаков двух главных компонент, получено такое же разбиение исходной совокупности стран на два кластера, как и в результате проведения кластерного анализа тех же стран по методу K-средних с выбором стандартизованных исходных признаков в каче-
стве классификационных.
6.Поскольку при выполнении п. 5 работы 6 не удалось выявить общие факторы, классифицировать страны по общим факторам невозможно.
7.По результатам выполнения пп. 1 — 6 составим сводную таблицу (табл. 3.7.1).
85
Быстрый кластерный анализ
Начальные центры кластеров
|
|
|
Кластер |
|
||
|
|
|
1 |
|
2 |
|
|
Z-знач: x(1) |
2,455 |
–0,818 |
|
||
|
Z-знач: x (2) |
–0,966 |
1,154 |
|
||
|
Z-знач: x3) |
–0,594 |
1,333 |
|
||
|
Z-знач: x (4) |
–3,243 |
0,646 |
|
||
|
Z-знач: x (5) |
2,187 |
0,918 |
|
||
|
|
История итерацийa |
||||
Итерация |
Изменения центров кластеров |
|||||
|
|
1 |
|
|
2 |
|
1 |
|
1,994 |
|
|
1,758 |
|
2 |
|
0,000 |
|
|
0.000 |
a. Сходимость достигнута по критерию малой величины или отсутствия изменений в положении центров кластеров. Максимальное абсолютное изменение координаты любого кластера составляет 0,000. Текущая итерация 2.
Минимальное расстояние между начальными центрами 6,609.
Принадлежность к кластерам
Номер наблюдения |
|
Страна |
КластерРасстояние |
||||||||||
1 |
|
|
|
|
Австралия |
2 |
1,437 |
||||||
2 |
|
|
|
|
Австрия |
2 |
1,221 |
||||||
3 |
|
|
|
|
Беларусь |
2 |
0,837 |
||||||
4 |
|
|
|
|
Бразилия |
2 |
1,560 |
||||||
5 |
|
|
|
Великобритания |
2 |
1,667 |
|||||||
6 |
|
|
|
|
Вьетнам |
2 |
2,094 |
||||||
7 |
|
|
|
|
Германия |
2 |
1,758 |
||||||
8 |
|
|
|
|
Замбия |
1 |
1,570 |
||||||
9 |
|
|
|
|
Индия |
1 |
2,316 |
||||||
10 |
|
|
|
|
Италия |
2 |
1,487 |
||||||
11 |
|
|
|
|
Канада |
2 |
1,677 |
||||||
12 |
|
|
|
|
Китай |
2 |
1,498 |
||||||
13 |
|
|
|
|
Мексика |
2 |
1,617 |
||||||
14 |
|
|
|
|
Польша |
2 |
0,777 |
||||||
15 |
|
|
|
|
Россия |
2 |
1,184 |
||||||
16 |
|
|
|
|
США |
2 |
1,876 |
||||||
17 |
|
|
|
|
Украина |
2 |
1,049 |
||||||
18 |
|
|
|
Филиппины |
2 |
2,062 |
|||||||
19 |
|
|
|
|
Эфиопия |
1 |
1,994 |
||||||
20 |
|
|
|
|
ЮАР |
1 |
1,495 |
||||||
|
|
Конечные центра кластеров |
|
|
|||||||||
|
|
|
|
|
|
Кластер |
|
|
|
|
|||
|
|
|
|
|
|
1 |
|
2 |
|
|
|
|
|
|
|
|
Zscore: x(1) |
1,704–0,426 |
|
|
|
|
|||||
|
|
|
Zscore: x(2) |
–0,856 |
0,214 |
|
|
|
|
||||
|
|
|
Zscore: x(3) |
–0,090 |
0,023 |
|
|
|
|
||||
|
|
|
Zscore: x(4) |
–1,571 |
0,393 |
|
|
|
|
||||
|
|
|
Zscore: x(5) |
1,593–0,398 |
|
|
|
|
|||||
|
Расстояния между конечными центрами кластеров |
|
|||||||||||
|
|
|
|
Кластер |
1 |
|
2 |
|
|
|
|
|
|
|
|
|
1 |
|
3,677 |
|
|
|
|
|
|||
|
|
|
2 |
3,677 |
|
|
|
|
|
|
|
||
|
Число наблюдений в каждом кластере |
|
|||||||||||
|
Кластер |
1 |
|
|
|
|
|
|
|
|
4,000 |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
16,000 |
|
|
|
Валидные |
|
|
|
|
|
|
|
|
|
|
20,000 |
|
|
Пропущенные значения |
|
|
|
|
|
|
0,000 |
|
Рис. 3.7.13. Результаты работы программы «Кластерный анализ методом K-средних»
86
Рассчитаем внутрикластерные средние и дисперсии каждого из пяти признаков. Для этого обратимся (с помощью выбора пункта меню «Анализ | Сравнение средних | Средние…») к программе «Средние» (рис. 3.7.14), введя в список зависимых переменных для сравнения средних значений переменные «x(1)», «x(2)», «x(3)», «x(4)», «x(5)», а в список независимых переменных
вводя по очереди переменные «CLU2_2», «CLU2_3», «QCL_1».
В окне ввода параметров программы «Средние», вызываемом нажатием кнопки «Параметры…» (рис. 3.7.15), укажем, что в результатах работы
программы необходимо вывести для каждой комбинации «кластер — признак» среднее значение данного признака в данном кластере («Среднее»), количество объектов в кластере («Число наблюдений»), среднее квадратичное отклонение («Стандартное отклонение») и дисперсию («Дисперсия»).
Рис. 3.7.14. Окно ввода данных программы «Средние»
Рис. 3.7.15. Окно ввода параметров программы «Means»
87
Результаты работы программы для варианта разбиения с объединением по методу дальнего соседа представлены на рис. 3.7.16.
Внесем средние значения и исправленные выборочные дисперсии в табл. 3.7.1 и вычислим для каждого варианта разбиения сумму внутриклассовых дисперсий признаков. Эта сумма минимальна для первого варианта разбиения стран на кластеры.
Средние
Сводка обработки наблюдений
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Наблюдения |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
Включенные |
|
|
|
Исключенные |
|
|
|
Итого |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
N |
|
Процент |
|
N |
|
Процент |
|
N |
|
Процент |
|
|
|||||||||||
|
|
x(1) * Single Linkage |
|
|
20 |
100,0% |
|
|
|
0 |
|
,0% |
|
20 |
|
|
100,0% |
|
|
||||||||||
|
|
x(2) * Single Linkage |
|
|
20 |
100,0% |
|
|
|
0 |
|
,0% |
|
20 |
|
|
100,0% |
|
|
||||||||||
|
|
x(3) * Single Linkage |
|
|
20 |
100,0% |
|
|
|
0 |
|
,0% |
|
20 |
|
|
100,0% |
|
|
||||||||||
|
|
x(4) * Single Linkage |
|
|
20 |
100,0% |
|
|
|
0 |
|
,0% |
|
20 |
|
|
100,0% |
|
|
||||||||||
|
|
x(5) * Single Linkage |
|
|
20 |
100,0% |
|
|
|
0 |
|
,0% |
|
20 |
|
|
100,0% |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
Отчет |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Single Linkage |
|
x(1) |
|
|
x(2) |
|
|
|
x(3) |
|
|
|
x(4) |
|
|
x(5) |
|
|
|||||||||
|
1 |
Среднее |
|
|
1,934 |
|
11 137,07 |
|
88,14 |
|
|
94,86 |
|
|
|
15,21 |
|
|
|
||||||||||
|
|
|
N |
|
|
|
|
|
14 |
|
|
|
|
14 |
|
14 |
|
|
14 |
|
|
|
14 |
|
|
|
|||
|
|
|
Стд.Отклонение |
|
|
0,487 |
|
8003,15 |
|
81,76 |
|
|
7,26 |
|
|
|
4,84 |
|
|
|
|||||||||
|
|
|
Последнее |
|
|
0,237 |
|
64 050 482,37 |
|
6685,22 |
|
|
52,75 |
|
|
|
23,41 |
|
|
|
|||||||||
|
2 |
Среднее |
|
|
4,837 |
|
865,83 |
|
135,83 |
|
|
67,17 |
|
|
|
34,67 |
|
|
|
||||||||||
|
|
|
N |
|
|
|
|
|
6 |
|
|
|
|
6 |
|
|
|
6 |
|
|
6 |
|
|
|
6 |
|
|
|
|
|
|
|
Стд.Отклонение |
|
|
1,557 |
|
1141,04 |
|
117,73 |
|
|
25,14 |
|
|
|
8,78 |
|
|
|
|||||||||
|
|
|
Последнее |
|
|
2,423 |
|
1 301 961,37 |
|
13 860,97 |
|
|
632,17 |
|
|
|
77,07 |
|
|
|
|||||||||
|
|
Итого |
Среднее |
|
|
2,805 |
|
8055,70 |
|
102,45 |
|
|
86,55 |
|
|
|
21,05 |
|
|
|
|||||||||
|
|
|
N |
|
|
|
|
|
20 |
|
|
|
|
20 |
|
20 |
|
|
20 |
|
|
|
20 |
|
|
|
|||
|
|
|
Стд.Отклонение |
|
|
1,632 |
|
8215,07 |
|
93,41 |
|
|
19,29 |
|
|
|
10,95 |
|
|
|
|||||||||
|
|
|
Последнее |
|
|
2,663 |
|
67 487 319,59 |
|
8724,63 |
|
|
371,95 |
|
|
|
119,95 |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
Таблица ANOVA |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма |
ст.св. |
Средний |
|
|
F |
|
|
Знч. |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
квадратов |
|
|
|
квадрат |
|
|
|
|
|
|
|||||
x(1) * Single Linkage |
Между группами |
(Комбинированная) |
|
|
35,40 |
1 |
35,39 |
|
41,94 |
|
0,000004 |
||||||||||||||||||
|
|
|
|
В группах |
|
|
|
|
|
|
|
|
15,19 |
18 |
0,84 |
|
|
|
|
|
|||||||||
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
50,59 |
19 |
|
|
|
|
|
|
|
|
|
||||||
x(2) * Single Linkage |
Между группами |
(Комбинированная) |
443 092 944,44 |
1 |
443 092 944,44 |
|
9,50 |
|
0,006415 |
||||||||||||||||||||
|
|
|
|
В группах |
|
|
|
|
|
|
839 166 077,76 |
18 |
46 620 337,65 |
|
|
|
|
|
|||||||||||
|
|
|
|
Итого |
|
|
|
|
|
|
1 282 259 072,20 |
19 |
|
|
|
|
|
|
|
|
|
||||||||
x(3) * Single Linkage |
Между группами |
(Комбинированная) |
|
|
9556,26 |
1 |
9555,26 |
|
1,10 |
|
0,307926 |
||||||||||||||||||
|
|
|
|
В группах |
|
|
|
|
|
|
|
|
156 212,75 |
18 |
8678,44 |
|
|
|
|
|
|||||||||
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
165 768,01 |
19 |
|
|
|
|
|
|
|
|
|
||||||
x(4) * Single Linkage |
Между группами |
(Комбинированная) |
|
|
3220,40 |
1 |
3220,40 |
|
15,07 |
|
0,001092 |
||||||||||||||||||
|
|
|
|
В группах |
|
|
|
|
|
|
|
|
3846,54 |
18 |
213,70 |
|
|
|
|
|
|||||||||
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
7066,95 |
19 |
|
|
|
|
|
|
|
|
|
||||||
x(5) * Single Linkage |
Между группами |
(Комбинированная) |
|
|
1589,26 |
1 |
1589,26 |
|
41,48 |
|
0,000005 |
||||||||||||||||||
|
|
|
|
В группах |
|
|
|
|
|
|
|
|
689,69 |
18 |
38,32 |
|
|
|
|
|
|||||||||
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
2278,95 |
19 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
Меры связи |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Эта |
Эта квадрат |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
x(1) * Single Linkage |
|
|
|
0,578 |
|
|
0,334 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
x(2) * Single Linkage |
|
|
|
0,227 |
|
|
0,052 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
x(3) * Single Linkage |
|
|
|
0,140 |
|
|
0,020 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
x(4) * Single Linkage |
|
|
|
0,763 |
|
|
0,583 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
x(5) * Single Linkage |
|
|
|
0,515 |
|
|
0,265 |
|
|
|
|
|
|
|
|
|
Рис. 3.7.16. Результаты работы программы «Средние»
88
8. В таблице результатов дисперсионного анализа («Таблица ANOVA»), полученной в результате работы программы «Средние» для
первого варианта разбиения (рис. 3.7.16) содержатся данные для проверки гипотез о равенстве математических ожиданий признаков в двух кластерах (при альтернативных гипотезах о различии математических ожиданий признаков). В последнем столбце («Знч.») содержится рассчитанный уровень значимости (P-значение).
Рассчитанный уровень значимости меньше 0,05 для первого, второго, четвертого и пятого признаков, поэтому есть основания отвергнуть гипотезы о равенстве математических ожиданий признаков x(1), x(2), x(4), x(5) в двух
кластерах, а оснований отвергнуть гипотезу о равенстве математических ожиданий признака x(3) в двух кластерах нет.
Таким образом, можно заключить, что математические ожидания среднего числа детей в семье (x(1)), ВВП на душу населения (x(2)), процента грамотных (x(4)) и рождаемости (x(5)) в двух кластерах различны, а математические ожидания плотности населения (x(3)) в двух кластерах одинаковы.
Это дает основания назвать первый кластер (Австралию, Австрию, Беларусь, Бразилию, Великобританию, Германию, Италию, Канаду, Китай, Мексику, Польшу, Россию, США и Украину) группой более развитых стран, а второй кластер (Вьетнам, Замбию, Индию, Филиппины, Эфиопию и ЮАР) — группой менее развитых стран.
9. Результатом регрессионного анализа (с исключением) признака Y на признаки x(1), x(2), x(3), x(4), x(5) для первого кластера стало уравнение
ˆyf = 2,38 −13,21x(1) + 0,000362x(2) + 0,64x(4) + 1,85x(5) .
Это уравнение и все его коэффициенты значимы, оценка нормированного коэффициента детерминации равна 0,86. (Студент должен приложить к работе распечатки результатов расчетов, полученных с помощью компьютерных программ регрессионного анализа.)
Анализ этого уравнения позволяет сделать следующие выводы:
∙увеличение на единицу среднего числа детей в семье x(1) (при неизмен-
ных значениях ВВП на душу населения, процента грамотных и рождаемости) сопровождается уменьшением средней продолжительности жизни мужчины в странах из первого кластера на 13,21 года (в целом по 52 странам увеличение среднего числа детей в семье на единицу, как было показано при выполнении п. 6 работы 5, сопровождается уменьшением средней продолжительности жизни мужчины на 3,22 года);
∙увеличение на единицу ВВП на душу населения x(2) (при неизменных
значениях среднего числа детей в семье, процента грамотных и рождаемости) сопровождается увеличением средней продолжительности жизни мужчины в странах из первого кластера на 0,000362 года (в целом по 52 странам увеличение ВВП на душу населения на единицу, как было показано при выполнении п. 6 работы 5, сопровождается увеличением средней продолжительности жизни мужчины на 0,000375 года);
∙увеличение на единицу плотности населения x(3) в странах из первого
кластера не сопровождается изменением средней продолжительности жизни мужчины (как и в целом по 52 странам — см. результаты выполнения п. 6 работы 5);
89
90
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 3.7.1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма |
Метод |
Номер |
|
Страны, |
|
|
|
|
|
|
|
|
|
|
|
|
|
Внутриклассовые |
|
|
|
|
|
|
|
|
|
Внутриклассовые |
|
внутри- |
|||||||||||||||||||||||||
разбиения |
кластера |
вошедшие в кластер |
|
|
|
|
|
средние значения признаков |
|
|
|
дисперсии признаков |
|
классовых |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
дисперсий |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Австралия, Австрия, Бела- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
русь, |
Бразилия, |
Велико- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 (1) |
= 0,24, s2X(2) |
= 64 050 482,38, |
|
|||
|
|
|
|
|
|
|
|
|
x(1) |
|
= 1,93, x(2) |
= 11137,07, |
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
1 |
британия, Германия, Ита- |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
лия, Канада, Китай, Мекси- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 |
|
= 6685,22, s2 (4) |
= 52,75, s2 (5) |
= 23,41 |
|
|||||||
дальнего |
|
|
|
|
x |
(3) |
= |
88,14, x |
(4) |
|
= |
94,86, x |
(5) = |
15,21 |
(3) |
|
||||||||||||||||||||||||||||||||||||||
|
ка, Польша, Россия, США, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
X |
|
X |
|
65 373 778,00 |
|||||||||||||||||||||||||||
соседа |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
Украина |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
Вьетнам, Замбия, Индия, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 (1) |
= 2,42, s2 (2) = 1301961,37, |
|
||||||
|
|
|
x(1) |
|
= 4,84, x(2) |
= 865,83, x(3) |
= 135,83, |
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
2 |
Филиппины, |
Эфиопия, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 |
|
= 13 860,97, sX2 |
|
= 632,17, s2X(5) = 77,07 |
|
||||||||
|
|
ЮАР |
|
|
|
|
|
|
|
|
|
|
|
|
x(4) |
|
= 67,17, x(5) |
= 34,67 |
|
(3) |
(4) |
|
||||||||||||||||||||||||||||||||
|
|
Австралия, Австрия, Бела- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
русь, Бразилия, Велико- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
британия, Вьетнам, Герма- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 (1) |
= 0,71, s2 |
|
= 66 945 757,69, |
|
|||||||||||||||||||
|
|
x(1) |
= 2,24, x(2) = 9420,24, x(3) |
= 100,47, |
|
|
|
(2) |
|
|||||||||||||||||||||||||||||||||||||||||||||
|
1 |
ния, Италия, Канада, Ки- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
X |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 |
|
= 7604,06, s2X(4) |
= 66,06, s2X(5) |
= 51,85 |
|
||||||||
средней |
|
тай, Мексика, Польша, Рос- |
|
|
|
|
|
|
|
|
|
|
x(4) |
|
= 93,06, x(5) |
= 17,71 |
|
(3) |
67 028 609,07 |
|||||||||||||||||||||||||||||||||||
связи |
|
сия, США, Украина, Фи- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
липпины, ЮАР |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2 |
|
= 1,71, s2 |
(2) = 52 602,33, |
|
||
|
|
|
|
|
|
|
x(1) |
= 5,99, |
|
|
x(2) |
= 323,33, x(3) |
= 113,67, |
|
|
|
(1) |
|
||||||||||||||||||||||||||||||||||||
|
2 |
Замбия, Индия, Эфиопия |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
X |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 |
|
= 21829,33, s2X(4) |
= 604,33, sX2 |
(5) = 91,00 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x(4) |
|
= 49,67, x(5) |
= 40,00 |
|
(3) |
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s2X(1) |
= 1,80, sX2 (2) = 2 001607,00, |
|
||||
|
1 |
Замбия, Индия, |
Эфиопия, |
|
x(1) |
|
= 5,59, x(2) |
= 1024,50, x(3) = 94,00, |
|
|
|
|||||||||||||||||||||||||||||||||||||||||||
|
ЮАР |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 |
|
= 16100,00, s2X(4) |
= 576,25, sX2 |
(5) = 69,67 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
x(4) |
|
= 56,25, x(5) |
= 38,50 |
|
(3) |
|
|||||||||||||||||||||||||||||||||||
|
|
Австралия, Австрия, Бела- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
K-средних |
|
русь, |
Бразилия, |
Велико- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
70 630 607,86 |
|
британия, Вьетнам, Герма- |
|
|
|
|
|
|
|
|
|
|
|
|
|
= 2,11, |
|
|
|
|
|
= 9813,50, |
|
|
|
|
2 |
= |
2 |
|
= 68 604 359,00, |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
x |
(1) |
|
x |
(2) |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
2 |
ния, Италия, Канада, Ки- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX(1) |
0,44, sX(2) |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sX2 (3) |
= 7807,43, sX2 (4) |
= 49,85, s2X(5) |
= 36,50 |
|
|||||||||
|
|
тай, Мексика, Польша, Рос- |
|
|
x(3) |
= 104,56, x(4) |
= 94,13, x(5) = 16,69 |
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
сия, США, Украина, Фи- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
липпины |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|