Скачиваний:
84
Добавлен:
01.05.2014
Размер:
988.67 Кб
Скачать

3.6. Проблема оценки значений факторов и виды факторных моделей

Рассматривая методы определения общих факторов, мы приближенно оцениваем их значения, то есть восстанавливаем матрицу Fзначений факторов на совокупности исследуемых объектов. Согласно факторному уравнению, предположениесостоит в том, что исходные признаки можно выразить только через общие факторы. Отсюда следует, что и общие факторы можно выразить через линейные комбинации исходных признаков. Но такое предположение дает возможность, согласно факторному уравнению, также выразить и характерные факторы через линейные комбинации исходных признаков.

Заметим, что, рассматривая выше методы построения факторов, мы исходили из разложения , которое возникает при условии некоррелированности общих и характерных факторов, как между собой, так и друг с другом. Следовательно, система общих и характерных факторов образует базис- мерного пространства. Некорректность предположениясостоит в том, что тогдаnисходных признаков должны являться базисом- мерного пространства, что невозможно.

Отметим, что приближенные оценки значений факторов, особенно центроидных, просты. Это имеет значение при большой размерности исходных данных и особенно было важно при отсутствии вычислительной техники. Очевидно, что такие оценки факторов тем точнее, чем меньше характерности признаков. При нулевых характерностях оценки являются точными и соответствуют исходной корреляционной матрице. В этом случае общие факторы являются линейными комбинациями исходных признаков, метод главных факторов переходит в метод главных компонент, а метод центроидных факторов переходит в метод центроидных компонент. Следовательно, n исходных признаков образуют базисn-мерного пространства. Тогда для сохранения непротиворечивости факторной модели следует предположить коррелированность характерных факторов и справедливость лишь общего разложения исходной матрицы корреляций

.

Пусть число факторов совпадает с размерностью пространства , тогда вклады всех общих факторов (главных либо центроидных компонент) полностью объясняют дисперсии каждого признака. Тогда в разложенииRматрицаимеет единичные диагональные элементы, а матрицаявляется антидиагональной, то есть имеет нулевые диагональные элементы, при том, что матрицаявляется корреляционной матрицей общего вида. Перепишем это разложение в виде

,

где матрица D2является диагональной матрицей характерностей. Так как характерности равны нулю, то, а матрицаD2является нулевой. Можно показать, что метод главных компонент является решением следующей задачи: найти такие общие факторы, чтобы минимизировать суммарную дисперсию характерных факторов. Очевидно, что решением являютсяnобщих факторов, при которых матрица характерностейD2является нулевой.

Можно также показать, что такая задача эквивалентна следующей задаче: найти такие общие факторы, которые в совокупности наиболее близки к исходным признакам в том смысле, что совокупность их вкладов

,

то есть квадратов коэффициентов корреляций с признаками, максимальна.

В этом смысле метод центроидных компонент аналогичен методу главных компонент, за исключением того, что близость общих факторов к исходным признакам оценивается совокупностью вкладов другого вида

.

Очевидно, что решение также должно удовлетворять нулевой матрице D2.

Но в данном случае нельзя сказать, что задача построения центроидных факторов эквивалентна задаче минимизации суммарной дисперсии характерных факторов. Минимальность дисперсии характерных факторов приходится постулировать априори.

Остается заметить, что метод главных компонент дает единственное решение, в то время, как метод построения центроидных компонент обеспечивает лишь локальный экстремум функционала . Поэтому этот метод может давать, вообще говоря, различные результаты на одних и тех же данных.

С учетом всего изложенного выше, содержательный смысл метода главных компонент состоит в объяснении дисперсий исходных признаков. Данный метод плохо объясняет их корреляции. Действительно, в силу разложения , где матрицаявляется антидиагональной, коэффициенты корреляцииrijприсостоят из двух вкладов: ковариации вычисленных признаков и ковариации ненормированных характерных факторов. В свою очередь, содержательный смысл метода центроидных компонент близок к содержательному смыслу метода главных компонент. Именно поэтому для таких факторных моделей приняты специальные названия: модель главных компонент и модель центроидных компонент. Основное их отличие от исходной “классической“ модели состоит в том, что предполагается коррелированность характерных факторов.

В отличие от этих моделей, содержательный смысл исходной факторной модели и решений по методу главных и центроидных факторов состоит в объяснении не дисперсий, а корреляций исходных признаков через общие факторы. Действительно, в силу разложения , гдеD2является диагональной матрицей, коэффициенты корреляцииrijприопределяются только как ковариации вычисленных признаков. Данные методы плохо объясняют дисперсии исходных признаков, так как они включают в себя дисперсию соответствующего характерного фактора, которая может оказаться большой.

Мы выяснили, что за проблемой точного оценивания значений факторов стоят более глубокие проблемы, касающиеся самой сущности факторного анализа. Обеспечение такой возможности приводит в необходимости вместо исходной “классической” факторной модели рассмотреть другие модели, а именно, главных и центроидных компонент. Но введение таких моделей приводит к изменению содержательного смысла факторного решения.

В рамках исходной факторной модели при вычислении значений факторов ищут не их, а такие линейные комбинации исходных признаков, которые являются хорошими в некотором смысле оценками общих факторов. Предположив, что оценки факторов соответствуют истинным значениям, а отклонения являются случайными, найдем их по методу наименьших квадратов. Пусть даны матрицы , гдеB- матрица коэффициентов линейных комбинаций признаков,- матрица оценок факторов. Тогда. Требуется решить задачу

.

Заметим, что минимизация такой функции означает независимую минимизацию всех ее mкомпонент, так как общие факторы являются некоррелированными. Но такая минимизация означает и одновременную минимизацию всехm2элементов матрицыразмером, а не только ее диагональных элементов. Следовательно, требуется решить задачу. Преобразуем

;

;;;.

Отсюда .

Соседние файлы в папке Методы анализа больших массивов данных