51. Процедура факторного анализа

Факторный анализ проистекает из гипотезы, что изучаемое явление, описываемое исходной системой признаков, может быть описано посредством меньшего числа других признаков, называемых факторами. Например, при анализе политического поведения какой-либо социально-статусной группы нам необходимо установить наличие возможных взаимосвязей среди примерно пятидесяти различных параметров (места рождения, политических традиций семьи, возраста, характера полученного образования, особенностей жизненной траектории, политических предпочтений, типа политической идентификации и т.д.). Для изучения всех возможных взаимосвязей этих переменных потребовалось бы провести анализ свыше двенадцати тысяч корреляций. Вместо этого исследователь может свести их к меньшему числу скрытых (латентных) переменных, не поддающихся непосредственному измерению (например, уровень устойчивости политических взглядов, обоснованность принятия политического решения, мотивация участия в выборах, уровень кризисное™ взаимодействия политических агентов и т.д.), называемых обобщенными факторами (или просто факторами) и точно характеризующих всю совокупность исходных данных. Предполагается, что выделенные скрытые характеристики одновременно являются и наиболее существенными, определяющими.

Факторный анализ не предполагает предварительного разделения признаков на зависимые и независимые, поскольку все они оцениваются как равноправные. В исследовании факторный анализ может использоваться как разведочный (эксшораторный; служит для анализа уже измеренных переменных с целью их структурирования) и проверочный (конфирматорный\ он используется для проверки сформулированной гипотезы) метод анализа данных.

Исходная задача факторного анализа — компактное и всестороннее описание объекта исследования. Математическая модель этого вида анализа сходна с уравнением множественной регрессии:

где Г — значение /-й переменной, выраженное в виде линейной комбинации к общих факторов; А_1к— регрессионные коэффициенты, показывающие вклад

каждого из к факторов в данную переменную; F_k — факторы, общие для всех переменных; U — фактор, связанный только для переменной V.

Среди прочих задач факторный анализ понижает размерность корреляционной матрицы, он также используется как средство визуализации многопараметрических объектов и для косвенного оценивания изучаемых переменнвтх в случае невозможности их прямого измерения. Факторный анализ нужен для проверки, селекции уже выдвину- тых теоретических гипотез, кроме того он является источником новых гипотез. Факторный анализ активно используется и в типологических задачах.

Фактором называют гипотетическую латентную переменную, которая одновременно объединяет несколвко формально измеренных признаков объекта. Обобщение позволяет выделить связи между исходными переменными, которые ранее не были очевидны, а затем перейти на более высокий уровень понимания явления. Факторы являются относительно независимыми настолько, насколько имеется возможность разбить исходную систему признаков на группы таким образом, чтобы коэффициенты корреляции между признаками одной группы были высокими, а признаки различных групп малы. Факторные нагрузки — это корреляции между фактором как функциональным целым и значениями конкретных переменных, входящих в этот фактор. Обычно требуется, чтобы факторные нагрузки были не ниже 0,40.

Фактор также может быть записан в виде линейной комбинации наблюдаемых переменных:

F= W V_t + W.V, + ... + W. V,

где W._p — факторные нагрузки, которые определяют связь фактора с исходным признаком; V — количество переменных.

Факторный анализ включает в себя три этапа:

сбор данных и подготовку корреляционной матрицы; исходная таблица имеет п строк (по числу объектов) и т столбцов (по числу признаков) и преобразуется в матрицу парных коэффициентов корреляции;
выделение первоначалвнв!х ортогональных (некоррелированных, линейно независимых) факторов;
вращение факторной структуры и содержательную интерпретацию результатов.

Факторный анализ требует использования шкал не ниже интер- валвных. На практике это правило выполняется не всегда, ученые в силу ограниченности измерителвных инструментов для исследований политической тематики вынуждены обращаться к порядковым (балльным) шкалам. При этом допускается лишь эвристическое использование таких моделей без статистической интерпретации результатов. Эго положение означает, что можно подвергать факторному анализу переменные, измеренные с помощью порядковых шкал, но при этом нельзя оперировать собственными значениями факторов, нельзя определять более или менее значимые факторы. При использовании порядковых шкал с помощью факторного анализа можно лишь устанавливать кластерную структуру переменных.

Обработка данных в ходе факторного анализа предполагает трансформацию матрицы смешения в корреляционную матрицу, затем в факторную матрицу и, наконец, в факторную диаграмму.

Таблица факторных нагрузок (факторная матрица) содержит количество строк по числу признаков и количество столбцов по числу факторов. В факторном анализе используется множество методов, позволяющих трансформировать корреляционную матрицу в факторную. На практике наиболее предпочтительным считается метод главных компонент.

Метод главных компонент. С его помощью рассматриваются линейные модели, т.е. каждый исходный признак представляется как линейная комбинация факторов. Коэффициентами служат факторные нагрузки, которые указывают на величину и направленность связи между латентными и явно наблюдаемыми свойствами. С помощью процедуры главных компонент исследователи переходят от пространства высокой размерности, образованного явно наблюдаемыми свойствами, к пространству небольшого числа латентных факторов. В результате объекты описываются в терминах (координатах) этого нового пространства. Координаты объектов в пространстве латентных факторов называются факторными весами. Факторные веса показывают количественные значения выделенных факторов для каждого из имеющихся объектов.

Метод максимального правдоподобия (метод Лоули) позволяет при большой выборке получить статистический критерий значимости полученного факторного решения.

Метод наименьших квадратов предполагает минимизацию остаточной корреляции после выделения определенного числа факторов и оценку качества соответствия вычисленных и наблюдаемых коэффициентов корреляции по критерию минимума суммы квадратов отклонений.

Факторизация образов (анализ образов) предполагает, что общность каждой переменной определяется не как функция гипотетических факторов, а как линейная регрессия всех остальных переменных.

Рассмотрим последовательность действий в наиболее часто используемом методе главных компонент. Сначала вычисляются парные коэффициенты корреляции между переменными и строится корреляционная матрица. После трансформации корреляционной матрицы в факторную осуществляют анализ каждой из выделенных групп признаков с целью ее сжатия посредством выделения взаимодействий и представления в виде одного обобщенного показателя. Для формализации этой процедуры используют различные методы, в том числе весьма эффективный метод последовательных разбиений. В основе атгоритма лежит процедура последовательных разбиений объектов на классы — так, что при каждом разбиении образуются два класса, которые не пересекаются. Процедура последовательных разбиений завершается, когда новый шаг не увеличивает (или увеличивает незначительно) процент объясняемой дисперсии целевого признака. Образование в итоге «тупиковых классов», не подлежащих дальнейшему разбиению, означает прекращение процедуры.

В хорошо организованном исследовании суммарный процент объясненной дисперсии достигает 85—90% (на практике политологи считают факторный анализ очень успешным, если этот показатель составляет 72— 75%). Чаще всего, как свидетельствуют специалисты в области факторного анализа, этот суммарный процент объясняется тремя факторами. Тем не менее процедура факторного анализа на этом не заканчивается. Далее следует процедура вращения факторной структуры. Необходимость вращения факторов возникает, когда выявленным факторам не удается дать достаточно четкую содержательную интерпретацию. Например, факторные нагрузки для рассматриваемого фактора оказались близкими по величине и одинаковыми по знаку для многих признаков, в результате невозможно определить, какой фактор стоит за выделенной комбинацией признаков. Вращение позволяет сделать матрицу факторных нагрузок более понятной для интерпретации за счет увеличения нагрузок по одним признакам и уменьшения по другим.

Идеальным вариантом вращения считается результат, при котором каждая переменная получает максимальное число больших факторных нагрузок по одним факторам и одновременно наибольшее количество минимальных факторных нагрузок по другим факторам.

Выделяют два основных класса способа вращения:

ортогональное вращение, при котором при повороте осей координат угол между факторами остается прямым, т.е. сохраняется предположение о некоррелированности факторов. Существует несколько методов ортогонального вращения: варимакс (на практике используется чаще всего), квартимакс, эквимакс, биквартимакс. Цель вари макса — уменьшение? количества переменных, имеющих высокие нагрузки на данный фактор (это упрощает его описание) за счет группировки вокруг него только тех переменных, которые с ним связаны в большей степени, чем остальные. Квартимакс минимизирует количество факторов, необходимых для объяснения данной переменной. С его помощью выделяется один из общих факторов с достаточно высокими нагрузками на большинство переменных. В методиках вращения эквимакса и биквартимакса много общего, поскольку они ориентированы на одновременное упрощение описания и факторов, и переменных;
косоугольное вращение, при котором первоначальное ограничение по поводу некоррелированности факторов снимается. Среди методов косоугольного вращения наиболее популярен облимин, схожий с методом эквимакса. В расчетах с помощью облимина в статистических программах можно задавать специальный параметр (в разных пакетах его называют а или 5) косоугольности факторов при вращении.

Перед выполнением процедуры вращения в компьютерных программах задают количество факторов, в пространстве которых производится вращение. Вращение и анализ факторных диаграмм производятся несколько раз с учетом различного количества факторов. Обычно начинают с избыточного количества факторов, уменьшая их число и доводя его до необходимого предела.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 1415 / 2215 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.08.201974.24 Кб15ответы по светотехнике.doc
#
17.04.201986.02 Кб28ответы по теплофизике.doc
#
13.02.201592.16 Кб10ответы по философии(только некоторые).doc
#
21.04.2019244.2 Кб11ответы по философии.docx
#
25.11.201991.12 Кб6ответы по этике.docx
#
13.02.20152.09 Mб119ответы Подшибякина часть 2.rtf
#
13.02.2015102.21 Кб83ответы политическая бюрократия.docx
#
03.09.2019229.23 Кб14ОТВЕТЫ ПРОШЛЫХ ЛЕТ 2!!!!.docx
#
03.09.2019261.56 Кб19ОТВЕТЫ ПРОШЛЫХ ЛЕТ!!!!.docx
#
13.02.201552.24 Кб41Ответы с 34 по Тарасовой.docx
#
13.02.2015116.74 Кб22Ответы СЗФ.doc