Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
13.docx
Скачиваний:
42
Добавлен:
20.02.2016
Размер:
192.76 Кб
Скачать

4. Определение метода факторного анализа

Существует два метода — анализ главных компонент и анализ общих факторов. При анализе главных компонент (principal components analysis) учитывают всю дисперсию данных.

Анализ главных компонент рекомендуется выполнять, если основная задача исследователя — определение минимального числа факторов, которые вносят максимальный вклад в дисперсию данных, чтобы в последующем использовать их в многомерном анализе. Эти факторы называют главными компонентами (principal component).

В анализе общих факторов (common factor analysis) факторы определяют только на основании общей дисперсии. Общности располагаются на диагонали корреляционной матрицы. Этот метод подходит, если основной задачей является определение латентных переменных и общей дисперсии. Этот метод также известен как разложение матрицы (principal axis factoring).

Существуют и другие методы оценки общих факторов. Они включают: метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов, метод максимального правдоподобия, альфа-факторны и метод, распознования образов. Эти методы сложнее, и их не рекомендуется использовать неопытным аналитикам.

5. Определение числа факторов.

Для определения числа факторов предлагается несколько процедур: определение, основанное на предварительной информации; определение, основанное на собственных значениях факторов; критерий "каменистой осыпи"; определение на основе процента объясненной дисперсии; метод расщепления и критерии значимости.

Определение, основанное на предварительной информации. Иногда, руководствуясь предварительной информацией, исследователь знает, сколько факторов можно ожидать, и таким образом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают. Большинство компьютерных программ позволяют пользователю определить число факторов, значительно упрощая применение этого метода.

Определение, основанное на собственных значениях факторов. В этом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственное значение представляет значение дисперсии, обусловленной действием этого фактора. Следовательно, рассматривают только факторы с дисперсией выше 1,0. Если число переменных меньше 20, то этот метод завышает число факторов.

Определение, основанное на критерии "каменистой осыпи". Графическое изображение критерия "каменистой осыпи" представляет собой график зависимости собственных значений факторов от их номеров в порядке выделения. Для определения числа факторов используют форму графика. Обычно график имеет четкий разрыв между крутой частью кривой, где факторам свойственны большие собственные значения, и плавной хвостовой частью кривой, связанной с остальными факторами (в этом месте убывание собственных значений факторов слева направо максимально замедляется). Это плавное убывание собственных значений называется осыпь (scree). Опыт показывает, что точка, с которой начинается осыпь, указывает на действительное число факторов. Обычно число факторов, определенное по графику "каменистой осыпи'", на единицу или несколько единиц больше числа факторов, полученных методом, основанным на собственных значениях.

Определение на основе процента объясненной дисперсии. В этом методе число выделяемых факторов определяют так. чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня. Какой уровень дисперсии считать удовлетворительным, зависит от поставленной задачи. Однако рекомендуется выделять такое число факторов, которое объясняют, по крайней мере, 60% дисперсии.

Определение, основанное на оценке надежности, выполняемой расщеплением. В этом методе выборку расщепляют напополам и факторный анализ выполняют для каждой половины. При этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках.

Определение, основанное на критериях значимости. Можно определить статистическую значимость отдельных собственных значений и оставить только статистически значимые факторы. Недостаток этого метода в том, что при больших размерах выборок (больше 200) многие факторы, вероятно, статистически значимые, хотя с практической точки зрения, многие из них объясняют небольшую долю полной дисперсии.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]