Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
KM_i_MM_v_E.doc
Скачиваний:
3
Добавлен:
25.11.2019
Размер:
111.1 Кб
Скачать

Проблема вращения факторов.

Цель факторного анализа состоит в том, что бы на основе большого числа исходных переменных сконструировать гипотетические переменные (факторы). Выделенные факторы должны отражать задержание исходных данных, однако факторы выделенные методом главных факторов или другим методом редко содержательны интерпритируются. Их нагрузки очень чувствительны к введению новых переменных.

Цель вращения – найти такие факторы, которые легко интерпритировать по исходным признакам. При этом появление новых признаков не должно оказывать сильного влияния на величину факторных нагрузок. Критерием вращения служат так называемые – простая структура. К простой структуре предъявляют следующие требования:

  1. Каждый признак должен иметь высокую факторную нагрузку, хотя бы с одним фактором.

  2. Каждый фактор должен иметь высокие факторные нагрузки не менее чем с r-переменные.

  3. Должны иметь место такие признаки, которые с одним фактором имеют 0-ую или близкую, а с другими максимально большую.

  4. Если число факторов больше 4-х, то необходимо иметь как можно больше переменных с 0-ми факторными нагрузками.

  5. Следует стремиться к тому, что бы иметь как можно меньше переменных с высокими факторными нагрузками по 2-ум и более факторам

Алгебраический процесс вращения можно записать так

Формула 3

Элементами каждой матрицы преобразования является sin, cos.

Исходя из геометрического вращения В(бэта) – это угол на который поворачивается пару факторов в пространстве. Следует подчеркнуть, что в процессе вращения величина общности формула 4,

Проблема измерения факторов

Измерение факторов заключается в определении их значений для каждого объекта наблюдений, расчёт значений факторов включает 2 этапа:

  1. На первом этапе устанавливают коэффициенты регрессии каждого из факторов по переменным описывающим объекта. Для этого используется равенство формула 5.

  2. На втором этапе значение факторов по каждому из объектов определяют по формуле 6, которая для первого фактора выглядит так формула 6.

Общая схема дисперсионного анализа

В экономике часто встречаются объекты исследования состояние которых определяются факторами не имеющими количественной оценки. Такими факторами могут быть неуправляемая и управляемая переменная, которая по каким либо причинам не позволяют производить их изменения в данном эксперименте, а так же те неконтролируемые переменные уровни варьирования которые можно произвольно выбирать и фиксировать во времени. Для изучения влияния факторов подобного рода на функцию отклика у (игрик), их общего оценивания, ранжирования и выделения среди них существенных методы регрессионного анализа непригодны, поскольку они решают задачи определения вида математической модели при варьировании величины факторов. Рассмотрим постановку задачи дисперсионного анализа в общем виде. Пусть исследуется некоторый процесс описываемый функцией (формула 7) Величина у (игрик) может зависить по каким либо причинам от (н) независимых управляемых факторов (х1,х2,..хн) и их парных взаимодействий. При этом:

  1. Каждый фактор (хi) может варьироваться на (у) (i) уровнях

  2. Полный факторный эксперимент состоит из (N = u1,u2,…,un) серией независимых наблюдений по числу всех возможных неповторяющихся сочетаний уровней (n- факторов).

  3. Каждая (j- серия) Содержит (Mj - наблюдейния) yj1, Yj2, Yj3 параллельных опытов.

Требуется определить в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора (Xi) или взаимодействия фактора на оклик (Y) провести сравнение с другими факторами и выделить наиболее существенное.

2011-12-05

Пропущена лекция

Если число кластеров известно заранее, то устанавливается типичные их представители т.е. определяется значение признаков по типичным представителям. Если число кластеров заранее не задано и неизвестны их типичные представители, то их число принимаем условно равным = C. Каждый из объектов следует отнести к тому их С-классов, с которым он имеет минимальную по сравнению с другими классами величину функции расстояния. Т.к. во втором случае число С – не известно, оно подбирается методом перебора. Этот метод включает:

  1. Определение функции расстояния каждого объекта с каждым Фjk

  2. Установление порогового значения функции расстояния Фor (пороговая)

  3. Объединение объектов в одни кластер, когда расстояние между ними меньше чем пороговая. В результате объединения получается некоторое число кластеров, но часть объектов может остаться вне кластеров.

  4. Нахождение центров тяжести может по сформированным кластерам.

  5. Определение функции расстояния между центрами тяжести образованных кластеров между центрами тяжести и значением признаков по отдельным объектам между необъединёнными объектами.

Принцип последующего объединения остаётся неизменным. Объединение производится при значении функции расстояния меньше порогового. Процесс объединения завершается, когда все значения функции расстояния будут больше чем пороговое значение. Классификацию на основе перебора можно осуществить и без установления порогового значения. По такому алгоритму на этом шаге операции объединяются в один кластер два или несколько объектов, имеющие минимальную величину функции расстояния. На втором шаге находится центр тяжести по образованному кластеру и вновь определяются значения функции расстояния. Объединяются кластеры с минимальным значением функции расстояния.

На третьем и последующих шагах процесс объединения продолжается до тех пор, пока все объекты не будут объединены в кластер. На основе кластерного анализа может быть проведена классификация как объектов так и признаков. В качестве функции расстояния в этом случае используется величина arccos Rik. Где Rik – коэффициент парной корреляции между признаками i и k.

При Rik = 0, значение функции = П/2

А при Rik = 1, arccos Rik = 0

Процесс осреднения признаков может быть осуществлён по любому из описанных выше способов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]