- •Москва 2011
- •Цель работы.
- •Исходные данные.
- •Описательная статистика.
- •Корреляционная матрица
- •Кластерный анализ.
- •Иерархический;
- •Итерационный.
- •5.1. Иерархический кластерный анализ данных (Joining)
- •Алгоритм к-средних.
- •Характеристики каждого кластера.
- •Факторный анализ.
- •Анализ таблицы собственных чисел.
- •Определение необходимого количества факторов.
- •Канонический анализ
- •Проверка значимости канонических корней.
- •Факторная структура и избыточность
- •Канонические веса
- •Графическое изображение канонических значений
- •Многомерное шкалирование.
- •Заключение
Канонические веса
Канонические переменные - это взвешенные суммы переменных соответствующего множества
Приведенные выше веса соответствуют стандартизированным (z преобразованным) переменным обоих множеств. Можно использовать эти веса для вычисления значений канонических переменных.
Чем выше значение канонического веса (по модулю), тем больше вклад одной переменной в значение другой переменной.
Графическое изображение канонических значений
На полученном графике нет резко выраженных выбросов. Кроме того, отклонения от регрессионной линии не образуют каких-либо характерных очертаний (например, располагаясь в виде U или S вокруг линии регрессии). Поэтому можно заключить, что никаких заметных нарушений основных предположений канонического анализа не наблюдается.
Вывод: Исходя из выполненного анализа данных, можно заключить, что параметры количество городов, численность населения, площадь территории влияют на валовый региональный продукт, объем продукции сельского хозяйства и объем инвестиций, но не влияют на параметр среднедушевых денежных доходов.
Многомерное шкалирование.
Многомерное шкалирование (МНШ) можно рассматривать как альтернативу факторному анализу. В общем случае метод МНШ позволяет таким образом расположить "объекты" в пространстве некоторой небольшой размерности, чтобы достаточно адекватно воспроизвести наблюдаемые расстояния между ними. В результате можно "измерить" эти расстояния в терминах найденных переменных.
Многомерное шкалирование – это не просто определенная процедура, а скорее способ наиболее эффективного размещения объектов, приближенно сохраняющий наблюдаемые между ними расстояния. Другими словами, МНШ размещает объекты в пространстве заданной размерности и проверяет, насколько точно полученная конфигурация сохраняет расстояния между объектами. Говоря более техническим языком, МНШ использует алгоритм минимизации некоторой функции, оценивающей качество получаемых вариантов отображения.
Диаграмма Шепарда. Можно построить для текущей конфигурации точек график зависимости воспроизведенных расстояния от исходных расстояний. Такая диаграмма рассеяния называется диаграммой Шепарда. По оси ординат OY показываются воспроизведенные расстояния (сходства), а по оси OX откладываются истинные сходства (расстояния) между объектами (отсюда обычно получается отрицательный наклон).
Двумерное пространство
Трехмерное пространство
Четырехмерное пространство
Пятимерное пространство
Выводы:
При увеличении размерности приводит к улучшению показателей многомерного шкалирования (величины стресса):
2-мерное пространство: Stress=0,0900
3-мерное пространство: Stress=0,0588
4-мерное пространство: Stress=0,0386
5-мерное пространство: Stress=0,0268
При этом все показатели стресса можно назвать небольшими.