Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
57
Добавлен:
28.04.2017
Размер:
143.36 Кб
Скачать

Факторный анализ справочный материал. Факторный анализ и анализ главных компонент

Существует несколько статистических методов, которые позволяют исследовать отношения между переменными, не определяя, какие из них являются зависимыми, а какие – независимыми. Для этих методов все переменные оказываются в равном положении – ни одна из них не является более важной, чем другая. Первый метод, который мы рассмотрим, метод главных компонент, объясняет наибольшую вариативность в терминах наименьшего количества линейных комбинаций переменных. Второй метод, факторный анализ, объясняет отношения между переменными с помощью нескольких факторов, которые не могут быть прямо измерены. Оба метода основываются на корреляциях (или ковариациях) между исходными переменными и часто называются одним термином – факторный анализ.

Главными целями факторного анализа являются: (1) сокращение числа переменных и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Метод главных компонент

Метод главных компонент – это метод, который переводит большое количество связанных между собой (зависимых, коррелирующих) переменных в меньшее количество независимых переменных, так как большое количество переменных часто затрудняет анализ и интерпретацию информации. Строго говоря, этот метод не относится к факторному анализу, хотя и имеет с ним много общего. Специфическим является, во-первых, то, что в ходе вычислительных процедур одновременно получают все главные компоненты и их число первоначально равно числу исходных переменных; во-вторых, постулируется возможность полного разложения дисперсии всех исходных переменных, т.е. ее полное объяснение через латентные факторы (обобщенные признаки).

Например, представим, что мы провели исследование, в котором измерили у студентов интеллект по тесту Векслера, тесту Айзенка, тесту Равена, а также успеваемость по социальной, когнитивной и общей психологии. Вполне возможно, что показатели различных тестов на интеллект будут коррелировать между собой, так как они, в конце концов, измеряют одну характеристику испытуемого – его интеллектуальные способности, хотя и по-разному. Если переменных в исследовании слишком много (x1, x2, …, xp), а некоторые из них взаимосвязаны, то у исследователя иногда возникает желание уменьшить сложность данных, сократив количество переменных. Для этого и служит метод главных компонент, который создает несколько новых переменных y1, y2, …, yp, каждая из которых является линейной комбинацией первоначальных переменных x1, x2, …, xp:

y1=a11x1+a12x2+…+a1pxp

y2=a21x1+a22x2+…+a2pxp

(1)

yp=ap1x1+ap2x2+…+appxp

Переменные y1, y2, …, yp называются главными компонентами или факторами. Таким образом, фактор – это искусственный статистический показатель, возникающий в результате специальных преобразований корреляционной матрицы. Процедура извлечения факторов называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, определяемые в результате факторизации, как правило, не равноценны по своему значению.

Коэффициенты aij, определяющие новую переменную, выбираются таким образом, чтобы новые переменные (главные компоненты, факторы) описывали максимальное количество вариативности данных и не коррелировали между собой. Часто полезно представить коэффициенты aij таким образом, чтобы они представляли собой коэффициент корреляции между исходной переменной и новой переменной (фактором). Это достигается умножением aij на стандартное отклонение фактора. В большинстве статистических пакетов так и делается (в программе STATISTICA тоже). Коэффициенты aij называются факторными нагрузками. Обычно они представляются в виде таблицы, где факторы располагаются в виде столбцов, а переменные в виде строк:

Переменные

Фактор 1

Фактор2

Интеллект (по тесту Векслера)

0,86

0,02

Интеллект (по тесту Айзенка)

0,75

0,01

Интеллект (по тесту Равена)

0,91

0,18

Оценка по социальной психологии

0,04

0,79

Оценка по когнитивной психологии

0,13

0,85

Оценка по общей психологии

0,21

0,82

Такая таблица называется таблицей (матрицей) факторных нагрузок. Числа, приведенные в ней, являются коэффициентами aij.Число 0,86 означает, что корреляция между первым фактором и значением по тесту Векслера равна 0,86. Чем выше факторная нагрузка по абсолютной величине, тем сильнее связь переменной с фактором.