Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы Подшибякина часть 2.rtf
Скачиваний:
119
Добавлен:
13.02.2015
Размер:
2.09 Mб
Скачать

51. Процедура факторного анализа

Факторный анализ проистекает из гипотезы, что изучаемое явле­ние, описываемое исходной системой признаков, может быть описано посредством меньшего числа других признаков, называемых факто­рами. Например, при анализе политического поведения какой-либо социально-статусной группы нам необходимо установить наличие воз­можных взаимосвязей среди примерно пятидесяти различных параме­тров (места рождения, политических традиций семьи, возраста, харак­тера полученного образования, особенностей жизненной траектории, политических предпочтений, типа политической идентификации и т.д.). Для изучения всех возможных взаимосвязей этих переменных по­требовалось бы провести анализ свыше двенадцати тысяч корреляций. Вместо этого исследователь может свести их к меньшему числу скрытых (латентных) переменных, не поддающихся непосредственному измере­нию (например, уровень устойчивости политических взглядов, обосно­ванность принятия политического решения, мотивация участия в выбо­рах, уровень кризисное™ взаимодействия политических агентов и т.д.), называемых обобщенными факторами (или просто факторами) и точно характеризующих всю совокупность исходных данных. Предполагает­ся, что выделенные скрытые характеристики одновременно являются и наиболее существенными, определяющими.

Факторный анализ не предполагает предварительного разделения признаков на зависимые и независимые, поскольку все они оцени­ваются как равноправные. В исследовании факторный анализ может использоваться как разведочный (эксшораторный; служит для анализа уже измеренных переменных с целью их структурирования) и прове­рочный (конфирматорный\ он используется для проверки сформулиро­ванной гипотезы) метод анализа данных.

Исходная задача факторного анализа — компактное и всесторон­нее описание объекта исследования. Математическая модель этого вида анализа сходна с уравнением множественной регрессии:

где Г — значение /-й переменной, выраженное в виде линейной комбинации к общих факторов; А— регрессионные коэффициенты, показывающие вклад

каждого из к факторов в данную переменную; Fk — факторы, общие для всех переменных; U — фактор, связанный только для переменной V.

Среди прочих задач факторный анализ понижает размерность кор­реляционной матрицы, он также используется как средство визуализа­ции многопараметрических объектов и для косвенного оценивания изучаемых переменнвтх в случае невозможности их прямого измере­ния. Факторный анализ нужен для проверки, селекции уже выдвину- тых теоретических гипотез, кроме того он является источником новых гипотез. Факторный анализ активно используется и в типологических задачах.

Фактором называют гипотетическую латентную переменную, которая одновременно объединяет несколвко формально измерен­ных признаков объекта. Обобщение позволяет выделить связи между исходными переменными, которые ранее не были очевидны, а затем перейти на более высокий уровень понимания явления. Факторы яв­ляются относительно независимыми настолько, насколько имеется возможность разбить исходную систему признаков на группы таким образом, чтобы коэффициенты корреляции между признаками одной группы были высокими, а признаки различных групп малы. Фактор­ные нагрузки — это корреляции между фактором как функциональным целым и значениями конкретных переменных, входящих в этот фак­тор. Обычно требуется, чтобы факторные нагрузки были не ниже 0,40.

Фактор также может быть записан в виде линейной комбинации наблюдаемых переменных:

F= W Vt + W.V, + ... + W. V,

где W.p — факторные нагрузки, которые определяют связь фактора с исходным признаком; V — количество переменных.

Факторный анализ включает в себя три этапа:

  1. сбор данных и подготовку корреляционной матрицы; исходная таблица имеет п строк (по числу объектов) и т столбцов (по чис­лу признаков) и преобразуется в матрицу парных коэффициен­тов корреляции;

  2. выделение первоначалвнв!х ортогональных (некоррелирован­ных, линейно независимых) факторов;

  3. вращение факторной структуры и содержательную интерпрета­цию результатов.

Факторный анализ требует использования шкал не ниже интер- валвных. На практике это правило выполняется не всегда, ученые в силу ограниченности измерителвных инструментов для исследований политической тематики вынуждены обращаться к порядковым (балль­ным) шкалам. При этом допускается лишь эвристическое использова­ние таких моделей без статистической интерпретации результатов. Эго положение означает, что можно подвергать факторному анализу пере­менные, измеренные с помощью порядковых шкал, но при этом нельзя оперировать собственными значениями факторов, нельзя определять более или менее значимые факторы. При использовании порядковых шкал с помощью факторного анализа можно лишь устанавливать кла­стерную структуру переменных.

Обработка данных в ходе факторного анализа предпо­лагает трансформацию матрицы смешения в корреляционную матри­цу, затем в факторную матрицу и, наконец, в факторную диаграмму.

Таблица факторных нагрузок (факторная матрица) содержит ко­личество строк по числу признаков и количество столбцов по числу факторов. В факторном анализе используется множество методов, по­зволяющих трансформировать корреляционную матрицу в факторную. На практике наиболее предпочтительным считается метод главных компонент.

Метод главных компонент. С его помощью рассматриваются линей­ные модели, т.е. каждый исходный признак представляется как линей­ная комбинация факторов. Коэффициентами служат факторные на­грузки, которые указывают на величину и направленность связи между латентными и явно наблюдаемыми свойствами. С помощью процедуры главных компонент исследователи переходят от пространства высокой размерности, образованного явно наблюдаемыми свойствами, к про­странству небольшого числа латентных факторов. В результате объек­ты описываются в терминах (координатах) этого нового пространства. Координаты объектов в пространстве латентных факторов называются факторными весами. Факторные веса показывают количественные зна­чения выделенных факторов для каждого из имеющихся объектов.

Метод максимального правдоподобия (метод Лоули) позволяет при большой выборке получить статистический критерий значимости по­лученного факторного решения.

Метод наименьших квадратов предполагает минимизацию оста­точной корреляции после выделения определенного числа факторов и оценку качества соответствия вычисленных и наблюдаемых коэф­фициентов корреляции по критерию минимума суммы квадратов отклонений.

Факторизация образов (анализ образов) предполагает, что общность каждой переменной определяется не как функция гипотетических фак­торов, а как линейная регрессия всех остальных переменных.

Рассмотрим последовательность действий в наиболее часто ис­пользуемом методе главных компонент. Сначала вычисляются парные коэффициенты корреляции между переменными и строится корреля­ционная матрица. После трансформации корреляционной матрицы в факторную осуществляют анализ каждой из выделенных групп призна­ков с целью ее сжатия посредством выделения взаимодействий и пред­ставления в виде одного обобщенного показателя. Для формализации этой процедуры используют различные методы, в том числе весьма эф­фективный метод последовательных разбиений. В основе атгоритма ле­жит процедура последовательных разбиений объектов на классы — так, что при каждом разбиении образуются два класса, которые не пересе­каются. Процедура последовательных разбиений завершается, когда новый шаг не увеличивает (или увеличивает незначительно) процент объясняемой дисперсии целевого признака. Образование в итоге «ту­пиковых классов», не подлежащих дальнейшему разбиению, означает прекращение процедуры.

В хорошо организованном исследовании суммарный процент объяс­ненной дисперсии достигает 85—90% (на практике политологи считают факторный анализ очень успешным, если этот показатель составляет 72— 75%). Чаще всего, как свидетельствуют специалисты в области фактор­ного анализа, этот суммарный процент объясняется тремя факторами. Тем не менее процедура факторного анализа на этом не заканчивается. Далее следует процедура вращения факторной структуры. Необходи­мость вращения факторов возникает, когда выявленным факторам не удается дать достаточно четкую содержательную интерпретацию. На­пример, факторные нагрузки для рассматриваемого фактора оказались близкими по величине и одинаковыми по знаку для многих признаков, в результате невозможно определить, какой фактор стоит за выделенной комбинацией признаков. Вращение позволяет сделать матрицу фактор­ных нагрузок более понятной для интерпретации за счет увеличения на­грузок по одним признакам и уменьшения по другим.

Идеальным вариантом вращения считается результат, при котором каждая переменная получает максимальное число больших факторных нагрузок по одним факторам и одновременно наибольшее количество минимальных факторных нагрузок по другим факторам.

Выделяют два основных класса способа вращения:

  1. ортогональное вращение, при котором при повороте осей коор­динат угол между факторами остается прямым, т.е. сохраняется пред­положение о некоррелированности факторов. Существует несколько методов ортогонального вращения: варимакс (на практике использу­ется чаще всего), квартимакс, эквимакс, биквартимакс. Цель вари мак­са — уменьшение? количества переменных, имеющих высокие нагрузки на данный фактор (это упрощает его описание) за счет группировки вокруг него только тех переменных, которые с ним связаны в большей степени, чем остальные. Квартимакс минимизирует количество факто­ров, необходимых для объяснения данной переменной. С его помощью выделяется один из общих факторов с достаточно высокими нагрузка­ми на большинство переменных. В методиках вращения эквимакса и биквартимакса много общего, поскольку они ориентированы на одно­временное упрощение описания и факторов, и переменных;

  2. косоугольное вращение, при котором первоначальное ограниче­ние по поводу некоррелированности факторов снимается. Среди ме­тодов косоугольного вращения наиболее популярен облимин, схожий с методом эквимакса. В расчетах с помощью облимина в статистических программах можно задавать специальный параметр (в разных пакетах его называют а или 5) косоугольности факторов при вращении.

Перед выполнением процедуры вращения в компьютерных про­граммах задают количество факторов, в пространстве которых произ­водится вращение. Вращение и анализ факторных диаграмм произво­дятся несколько раз с учетом различного количества факторов. Обычно начинают с избыточного количества факторов, уменьшая их число и доводя его до необходимого предела.