Добавил:

arhimagist Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

конспект_АИД_полный_2017.doc

Скачиваний:

Добавлен:

08.07.2017

Размер:

4.26 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2521 22 23 24 25 > Следующая >>>

6.5. Метод центроидных факторов

Как было показано, согласно формуле вклада k-го фактора в общности признаков

метод главных факторов дает точное решение задачи максимизации квадратов коэффициентов корреляции исходных признаков последовательно с каждым из общих факторов.

Геометрически решение такой задачи означает, что очередной общий фактор F_k ищется как вектор, ортогональный к предыдущим факторам и ближайший к совокупности исходных признаков. Заметим, что близость по направлению двух векторов-признаков длинывN-мерном пространстве объектов оценивается модулем косинуса угла между ними, то есть модулем коэффициента их взаимной корреляции. Поэтому близость вектора F_k, ортогонального предыдущим векторам, к совокупности исходных признаковможно также оценить величиной вклада

Поставим, как и раньше, задачу последовательного выделения общих факторов, каждый из которых максимизирует свой вклад W_k в суммарную общность признаков.

Пусть, как и раньше, факторы упорядочены по своим вкладам . Найдем факторF₁ из условия максимума вклада W₁ , решив задачу на условный экстремум вида

при ограничениях .

Так как

то получим задачупри ограничениях.

Составим функцию Лагранжа

где вектор должен удовлетворять системе уравнений

Обозначим и получим систему уравнений

(3.1) .

Найдем . Для этого транспонируем, умножим справа наF₁и получим

и .

Отсюда , что означает максимум вкладаW₁, достигнутый при максимизации величины.

Снова рассмотрим уравнение (3.1) и, возведя его в квадрат, получим

Преобразуем и получим , откуда

(3.2) .

Следовательно, максимизация означает максимизацию квадратичной формы, где- вектор коэффициентов, принимающих значения +1 и -1.

Рассмотрим алгоритм определения вектора знаков , доставляющего максимум квадратичной форме. Пусть задан некоторый начальный произвольный вектор знаков. Пусть признаки перебираются циклически по одному и пусть проведеноs циклов просмотра и построен вектор . Нацикле все компоненты вектораперестраиваются по формуле, где- элемент редуцированной корреляционной матрицы, стоящий на пересеченииi строки и j столбца. Алгоритм прекращает работу, когда , то есть, когда ни одна компонентане изменила своего знака. Сразу отметим, что, в отличие от метода главных факторов, данный алгоритм обеспечивает лишь локальный максимум квадратичной формы. Но его достоинство состоит в том, что он чрезвычайно прост.

Для обоснования правила пересчета вектора знаков найдем из (3.1) искомый фактори подставим сюда выражение дляиз выражения (3.2):

(3.3) .

Так как , то вычислим ковариацию фактораF₁с вычисленным признакомY_jи получим. Так как, то

что дает выражение для алгоритма поиска максимума формы .

Вектор факторных нагрузок первого выделенного фактора F₁ на исходные признаки определяется, как известно, как вектор корреляций исходных признаков с фактором. Так как, то факторные нагрузки определим как

, где .

Тогда, с учетом (3.1), (3.2) и , получим

Следовательно, факторные нагрузки первого фактора есть

Формально оценку значений фактора F₁ можно получить из выражения (3.3). Но, так как вычисленные векторы Y_j неизвестны, то, сделав некорректное предположение , можно приближенно оценить фактор:

, где .

Вектору F₁можно придать следующий геометрический смысл. ВекторF₁является линейной комбинацией векторов признаков со знаками. Если, то векторX_jнадо оставить без изменения. Если, то векторX_jнадо заменить на противоположный такой же длины. Затем все векторы признаков сложить, а в качестве фактораF₁взять вектор длины, совпадающий по направлению с этой суммой. Такой вектор является вектором центра тяжести концов суммируемых векторов признаков. Поэтому такой фактор и называется центроидным.

После нахождения вектора a₁ факторных нагрузок фактора F₁ строится матрица остатков и для нее аналогично находится факторF₂ из условия максимизации его вклада W₂ и так далее. Вычисления заканчиваются после того, как было получено m факторов.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2521 22 23 24 25 > Следующая >>>

Соседние файлы в предмете Анализ и интерпретация данных

#
08.07.201728.67 Кб5вопросы2017.doc
#
08.07.201769.12 Кб11Задачи.doc
#
08.07.20174.26 Mб41конспект_АИД_полный_2017.doc