Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
mnogomern_analiz_dannih.doc
Скачиваний:
62
Добавлен:
12.03.2016
Размер:
675.84 Кб
Скачать

Сведения о матрицах, минимально необходимые для изучения фа

Матрицей называется прямоугольная или квадратная таблица чисел, рассматриваемая безотносительно к тому, что именно представляют собой эти числа и существуют ли между ними какие-то заранее определенные зависимости. Вертикальный ряд чисел, расположенных в матрице одно над другим, называется столбцом, горизонтальный ряд чисел – строкой. Матрица, в которой число строк равно числу столбцов, называется квадратной. В тех случаях, когда нужно обозначить какие-либо элементы матрицы, им приписываются соответствующие индексы, первый из которых указывает номер строки, а второй – номер столбца, в котором находится данный элемент.

Схема 1. Квадратная матрица 4Х4

Таким образом, в квадратной матрице, показанной на схеме 1, символ а23 обозначает элемент, находящийся на пересечении второй строки и третьего столбца. Вся матрица обозначается буквой А. С обеих сторон матрица ограничивается двумя вертикальными линиями. О матрице, имеющей т строк и п столбцов, говорят, что ее порядок составляет т х п. Квадратная матрица п х п имеет порядок п.

Общий элемент матрицы записывается в виде аij где i (индекс строки) может принимать последовательные значения 1, 2, 3, ..., т, а j (индекс столбца) может принимать последовательные значения 1, 2, 3, ..., п.

Транспонирование матрицы

Это важное понятие, часто встречающееся в факторном анализе. Представим себе, что строки матрицы А становятся столбцами, в результате чего возникает новая матрица, которая будет транспонированной по отношению к А. Обозначим новую матрицу А'. Приведем пример транспонирования матрицы

А

Схема 2. А/ - транспонированная матрица А

Симметрическая матрица

Если матрицаА квадратная и совпадает с транспонированной к ней матрицей, то матрица А симметрична. Другими словами, квадратная матрица А симметрична, если А' = А. Пример симметрической матрицы дает схема 3.

Схема 3. Симметрическая матрица

Если элементами матрицы являются коэффициенты корреляции данной совокупности переменных, то эта матрица – симметрическая. В факторном анализе, как правило, встречаются именно такие ситуации.

Умножение матриц

Матрицы можно умножить друг на друга. Операция умножения часто встречается в факторном анализе и поэтому мы обсудим ее подробнее. Не вдаваясь глубоко в теорию вопроса, ограничимся описанием практических правил умножения матриц.

Правила эти гораздо сложнее правил умножения в арифметике. Первое отличие между умножением в арифметике и в матричной алгебре состоит в том, что при умножении матриц не действует закон коммутативности, в соответствии с которым произведение не зависит от порядка, в котором стоят сомножители. Если умножаются матрицы, их произведение в общем случае зависит от этого порядка. Другими словами, А ВВ А.

Для умножения матрицы А на матрицу В необходимо выполнение следующего условия: матрица А должна иметь столько столбцов, сколько строк в матрице В. Сам процесс умножения исходит из правила «строка на столбец». Это правило означает, что каждый элемент матрицы-произведения представляет собой сумму произведений от умножения элементов строки первой матрицы на соответствующие элементы столбца -второй матрицы.

Таким образом, элемент, стоящий на пересечении второй строки и третьего столбца матрицы С, образуется путем последовательного умножения элементов второй строки матрицы А на соответствующие элементы третьего столбца матрицы В и суммирования произведений. В приведенном примере каждый элемент матрицы-произведения представляет собой сумму двух произведений. Если бы матрица А имела 3 столбца, а матрица В – три строки, то каждый элемент матрицы-произведения являлся бы суммой трех произведений.

Матрица, представляющая собой произведение двух матриц, будет иметь всегда столько строк, сколько их было в первой матрице, и столько столбцов, сколько их было во второй матрице. Если матрица порядка (р х а) умножается на матрицу порядка (q х г), то их произведение будет иметь порядок (р х г).

Виды матриц, чаще всего встречающиеся в ФА

Диагональная матрица. Это квадратная матрица, в которой отличны от нуля только элементы, лежащие на главной диагонали. Главной диагональю называется линия, связывающая левый верхний угол с правым нижним углом матрицы. Диагональная матрица изображена на схеме 4.

Схема 4. Диагональная матрица

Скалярная матрица. Если все элементы диагональной матрицы равны между собой, то такая матрица называется скалярной.

Схема 5. Скалярная матрица

Единичная матрица. Это диагональная матрица, у которой все элементы главной диагонали равны единице. Единичная матрица выполняет в матричной алгебре ту же роль, что и единица в арифметике.

Схема 6. Единичная матрица

Обратная матрица. Выше уже была рассмотрена операция умножения матриц. В матричном исчислении существует операция, соответствующая делению в арифметике. Известна простая зависимость, которую можно представить в виде: X1/X =1. Эта зависимость означает, что произведение любого числа на обратное ему число равно единице. В матричной алгебре существует такая же связь.

ВАЖНЕЙШИЕ ПОНЯТИЯ И ТЕХНИКА ФАКТОРНОГО АНАЛИЗА

Два вводных примера

Пусть имеются четыре переменные, отдельные значения которых получены в результате наблюдения за рядом индивидуумов. Вычислим все парные коэффициенты корреляции, в итоге получим следующую корреляционную матрицу:

Визуальный анализ показывает, что корреляционная матрица является симметрической, т. е. наддиагональные элементы представляют собой зеркальное отражение поддиагональных относительно главной диагонали. При рассмотрении матрицы бросается в глаза тот факт, что все коэффициенты корреляции положительны. Кроме того, между первой и второй переменными имеется относительно тесная корреляционная связь, третья переменная с первыми двумя связана слабее, а четвертая практически не зависит от всех предыдущих. Следуя обычной процедуре корреляционного анализа можно было бы проверить значимость каждого коэффициента корреляции.

Целью факторного анализа является извлечение на поверхность величины, так называемого фактора, который бы по возможности точнее позволил воспроизвести наблюдаемые корреляции. Этот фактор и связанная с ним процедура вычислений вначале являются гипотетическими.

Обсудим подход к выявлению фактора и к процедуре вычислений.

Наблюдавшиеся коэффициенты корреляции можно в каждом случае воспроизвести с помощью следующего уравнения:

R+ F1 F/1

A A/

Вектор F1 = (0,90 0,80 0,50 0,05) представляет собой фактор. Матрица R+ является матрицей воспроизведенных коэффициентов корреляции. Используя правило умножения матриц, выполним действие F1 • F/1, в результате чего получим матрицу R+, отличающуюся от R диагональными элементами. Диагональные элементы матрицы R+ называются общностями. Например, элементы первого столбца корреляционной матрицы получаем следующим образом:

0,90 • 0,90=0,81; 0,80 • 0,90-0,720; 0,50 • 0,90-0,45; 0,05 • 0,90 = 0,045. И так далее.

Таким образом из чисел (0,90 0,80 0,50 0,05) получаем наблюдаемую корреляционную матрицу.

Как получаются численные значения элементов вектора F1, нас пока не интересует. Их называют факторными нагрузками. Они позволяют произвести численно-формальное объяснение наблюдаемых коэффициентов корреляции. Это дает основание предполагать, что за ними стоит фактор, который мог бы их причинно обусловливать.

Таким образом, мы на примере познакомились с основным уравнением факторного анализа: R+ = F1F/1 редуцированная корреляционная матрица равна произведению факторной матрицы на транспонированную.

За наблюдаемыми величинами всегда стоит фактор, но непосредственно для измерения он недоступен. Он гипотетичен. Факторный анализ устанавливает такие гипотетические факторы и из-за этого способ образования гипотез имеет всегда локальный характер.

При приведении корреляционной матрицы (1) к форме (2) возникают две проблемы.

Диагональные элементы матрицы R+ меньше единицы. Эти диагональные элементы называются общностями, а их определение составляет первую проблему ФА, проблему общности.

Второй проблемой является определение фактора F1. Это так называемая проблема факторов. Обе проблемы будут обсуждаться далее подробнее.

Обратимся еще раз к примеру, иллюстрирующему равенство (2). Десять (4+3+2+1 = 10) различных значений элементов (диагональных и поддиагональных) корреляционной матрицы приведены к четырем элементам вектора F1. Эти четыре значения содержат ту же самую информацию, что и вся корреляционная матрица. Таким образом достигается упрощение, причем объем информации сохраняется. Факторные нагрузки соответствуют коэффициентам корреляции, т. е. переменная 1 имеет много общего с фактором F1 1 = 0,90), переменная 2 – немного меньше 2 = 0,80), переменная 3 – еще меньше (а3= 0,50). Переменная 4 почти не связана с фактором (а4 = 0,05).

Геометрически упрощение заключается в том, что единственная мера, а именно фактор F1, достаточна для отражения связей между переменными. Если каждую переменную представить в виде вектора, т. е., попросту говоря, в виде стрелки в пространстве, то в этом примере все стрелки примут одно направление, а именно направление фактора F1, который рассматривается как координатная ось одномерной системы координат. Длина стрелок зависит от длины факторных нагрузок (рис 5.).

ФакторF1

1.0

0.9 перем.1

0.8 перем.2

0.5 перем.3

0,05 перем.4

0.0

Рис. 5. Геометрическая интерпретация матрицы A(2).

Второй пример. Пусть по результатам наблюдений за четырьмя переменными составлена корреляционная матица Rh, диагональные элементы которой заменяем общностями, которые предполагаются известными.

При просмотре корреляционной матрицы бросается в глаза, что первая и вторая переменные сильно коррелируют друг с другом. Можно говорить также о наличии корреляции между третьей и четвертой переменными. Между остальными переменными корреляция не проявилась. В таком случае, когда в корреляционной матрице существуют как бы обособленно два центра тяжести, не связанных друг с другом, для объяснения корреляции используют два фактора. Пусть первый фактор будет F1= (0,90 0,80 0,05 0,05), второй F2 =(0,05 0,05 0,80 0,70). В целом вся корреляционная матрица составляется с помощью двух факторов, и всю модель можно представить в виде равенства (3) F1 F2

A A/

В равенстве (3) легко убедиться путем соответствующих вычислений. Первый элемент корреляционной матрицы равен: 0,8125 = 0,90 • 0,90+0,05 • 0,05, по тому же самому правилу умножения матриц получаем другие элементы.

При геометрической интерпретации векторы, соответствующие переменным, расположатся на плоскости. Координатные оси соответствуют факторам, векторы – переменным. Например, конец вектора 1 на рис.6 имеет координаты 0,90 (нагрузка первого фактора) и 0,05 (нагрузка второго фактора), которые берутся из матрицы А. Координатные оси являются факторами, на которые натянуто пространство, содержащее переменные.

F1

1.0

0.9

0.8

0.5

0.1

0.0 0.1 0.5 0.7 0.8 0.9 1.0 F2

Рис. 6. Геометрическая интерпретация матрицы А (3).

В этих двух примерах мы познакомились в первом приближении с рядом понятий и процедур, которые далее будут определены более подробно. Пока же назовем основные проблемы ФА и покажем схему их решения.

Схема решения и основные проблемы факторного анализа.

При проведении ФА все расчеты носят последовательный характер. Процедура выполнения вычислительных операций схематично представлена на рис.7. Четыре вертикальные стрелки соответствуют четырем основным проблемам, возникающим при проведении факторного анализа в тех местах схемы, куда указывают, стрелки.

Yij

R

Rh

F

V

P

Проблема

общности

Проблема

факторов

Проблема вращения

Проблема оценки значений факторов

Рис. 7. Схема факторного анализа. Процедур вычислений начинается с матрицы исходных данных Y. Горизонтальные стрелки указывают последовательность отдельных этапов ФА; вертикальные стрелки – 4 основные проблемы ФА

  1. ФА начинается с Y – матрицы, исходных данных. По ней вычисляется корреляционная матрица R. По главной диагонали корреляционной матрицы затем проставляют оценки общностей и получают Rh. Это составляет проблему общности, которая состоит в установлении оценок hi2 Это самая первая проблема, которая возникает в ходе факторного анализа.

  2. Стрелка между Rh, и F указывает на проблему факторов. Из Rh, с помощью определенных способов извлекают факторы, получая в результате матрицу F.

  3. Столбцы матрицы F ортогональны и занимают произвольную позицию в отношении переменных, определяемую методом выделения факторов. Возможно большое число матриц F, которые будут одинаково хорошо воспроизводить Рh. Из них должна быть выбрана одна, что составляет проблему вращения. Решение проблемы вращения одним из нескольких способов приводит к матрице V.

  4. И наконец, последняя проблема касается оценки значений факторов для каждого индивидуума.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]