- •Оглавление
- •Постановка задачи
- •Глава 1. «Компонентный анализ»
- •§1. «Проверка гипотезы: сколько факторов следует выделять?»
- •§2. «Интерпретация факторов (главных компонент)»
- •§3. «Построение диаграммы рассеивания»
- •§4. «Построение уравнения регрессии на главных компонентах»
- •Глава 2. «Кластерный анализ»
- •§1. «Построение и анализ дендрограмм»
- •§2. «Использование метода k-средних для классификации объектов»
- •§3. «Создание таблицы «состав кластеров»
- •§4. «Описание кластеров с помощью графических средств»
- •Глава3. «Дискриминантный анализ»
- •§1. «Уточнение результатов классификации»
- •§2. «Построение дискриминантной функции с помощью включения всех переменных»
- •2.1. Исследование качества классификации
- •2.2. Построение дискриминантной функции
- •2.3. Графический анализ результатов классификации
- •§3. «Построение дискриминантной функции с помощью пошагового алгоритма»
- •Заключение
- •Список литературы
- •Приложения
§2. «Интерпретация факторов (главных компонент)»
Таблица 2 «Матрица факторных нагрузок А»
Матрица компонентa |
|||||
|
Компонента |
||||
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
|
x1 |
,951 |
,082 |
-,125 |
,130 |
-,236 |
x2 |
,899 |
-,120 |
-,122 |
,355 |
,190 |
x3 |
,097 |
,788 |
,596 |
,114 |
,022 |
x4 |
,159 |
-,632 |
,757 |
,034 |
-,031 |
x5 |
,821 |
,066 |
,061 |
-,559 |
,068 |
Метод выделения: Анализ методом главных компонент. |
|||||
a. Извлеченных компонент: 2 |
Как видно из Таблицы 2, в рассматриваемой факторной модели первый фактор имеет высокие положительные корреляции с числом предприятий и организаций (x1), числом зарегистрированных преступлений в сфере экономики (x2) и внутренними затратами на научные исследования и разработки (x5) в регионе России. Значит, главную компоненту Z1 можно интерпретировать как уровень экономического развития региона.
Второй фактор имеет высокую факторную нагрузку с просроченной задолженностью по заработной плате (x3) в регионе и связь средней тесноты с индексами цен производителей промышленных товаров (x4) в регионе. Причем в случае просроченной задолженности по заработной плате наблюдается положительная корреляция между главной компонентной и исходной переменной, а в случае индексов цен – отрицательная. Главную компоненту Z2 можно интерпретировать как характеристику доходности ведения предпринимательской деятельности в регионе.
Вращение факторной матрицы методом Варимакс можно не выполнять, так как матрица факторных нагрузок и до вращения удобна для интерпретации – в ней все факторные нагрузки либо большие, либо маленькие.
Расчет коэффициентов интерпретации:
Полученный результат говорит о том, что выбранные три переменные (x1, x2 и x5) объясняют 98,57% дисперсии первой главной компоненты Z1.
Полученный результат говорит о том, что выбранные две переменные (x3 и x4)объясняют 97,56% второй главной компоненты Z2.
§3. «Построение диаграммы рассеивания»
Рисунок 2 «Классификация регионов России в осях первой и второй главных компонент»
Рисунки 2 и 3 демонстрируют, что нельзя с полной уверенностью утверждать, что исходные данные подчиняются нормальному закону распределения, так как хотя и на двумерной, и на трехмерной диаграмме рассеивания существует область, в которой объекты расположены достаточно густо, однако форма облака едва ли может напоминать эллипс. Ранее данный вывод был подтвержден проверкой данных на нормальный закон распределения: хотя коэффициенты асимметрии и эксцесса для каждой из пяти факторных переменных не превышали по модулю двух, среднее значение, мода и медиана существенно отличались друг от друга.
Рисунок 3 «Классификация регионов России в осях первой, второй и третьей главных компонент»