Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Российский экономический университет им. Г.В. Плеханова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

BM_R3.DOC

Скачиваний:

Добавлен:

25.11.2019

Размер:

333.31 Кб

Скачать

☆

1 / 41 2 3 4 > Следующая >>>

3. Компонентный анализ Для замечаний

3. Компонентный и факторный анализ

3.1. Основы компонентного анализа

Компонентный анализ предназначен для преобразования системы k исходных признаков, в систему k новых показателей (главных компонент). Главные компоненты не коррелированны между собой и упорядочены по величине их дисперсий, причем, первая главная компонента, имеет наибольшую дисперсию, а последняя, k-я, наименьшую. При этом выявляются неявные, непосредственно не измеряемые, но объективно существующие закономерности, обусловленные действием как внутренних, так и внешних причин.

Компонентный анализ является одним из основных методов факторного анализа. В задачах снижения размерности и классификации обычно используются m первых компонент (m< k).

При наличии результативного показателя может быть построено уравнение регрессии на главных компонентах.

На основании матрицы исходных данных:

Х=

размерности (nk) , где x_ij– значение j-го показателя у i-го наблюдения (i=1,2,...,n; j=1,2,...,k) вычисляют средние значения показателей , а также s₁, ..., s_k и матрицу нормированных значений:

с элементами:

z_ij= .

Рассчитывается матрица парных коэффициентов корреляции:

R= Z^TZ (3.1)

с элементами:

r_jl= = (3.2)

где, j,1 = 1,2, ..., k.

На главной диагонали матрицы R, т.е. при j=l,

Модель компонентного анализа имеет вид:

(3.3)

где:

a_i_ – “вес”, факторная нагрузка, -ой главной компоненты на j-ой переменной;

f_i_ – значение -й главной компоненты для i-го наблюдения (объекта), где =1,2, ... ,k.

В матричной форме модель (3.3) имеет вид:

Z = F A^T (3.4)

где:

сти (nk);

– матрица значений главных компонент размерно-

– матрица факторных нагрузок размерности (kk).

А^Т – транспонированная матрица А;

f_i_– значение -й главной компоненты у i-го наблюдения (объекта);

a_j_ – значение факторной нагрузки -й главной компоненты на j-й переменной.

Матрица F описывает n наблюдений в пространстве k главных компонент. При этом элементы матрицы F нормированы, то есть: , а главные компоненты не коррелированы между собой. Из этого следует, что,

(1/n) F^TF = E (3.5)

где,

– единичная матрица размерности (kk).

Выражение (3.5) может быть также представлено в виде:

(3.6)

С целью интерпретации элементов матрицы А, рассмотрим выражение для парного коэффициента корреляции, между Z_j-переменной и, например, f₁-й главной компонентой. Так как, z_j и f₁ нормированы, будем иметь с учетом (3.3.):

Принимая во внимание (3.6), окончательно получим:

Рассуждая аналогично, можно записать в общем виде:

(3.7)

для всех j=1,2, ... , k и =1,2, ... , k.

Таким образом, элемент a_jv матрицы факторных нагрузок А, характеризует тесноту линейной связи между z_j-исходной переменной и f_v-й главной компонентой, то есть –1  a_j_  +1.

Рассмотрим теперь выражение для дисперсии z_j-й нормированной переменной. С учетом (3.3) будем иметь:

где , '=1,2, ... , k.

Учитывая (3.6), окончательно получим:

(3.8)

По условию переменные z_j нормированы и s_j²=1. Таким образом, дисперсия z_j-й переменной согласно (3.8), представлена своими составляющими, определяющими долю вклада в нее всех k главных компонент.

Полный вклад -й главной компоненты в дисперсию всех k исходных признаков вычисляется по формуле:

(3.9)

Одно из основополагающих условий метода главных компонент, связано с представлением корреляционной матрицы R, через матрицу факторных нагрузок А. Подставив для этого (3.4) в (3.1), будем иметь:

R=(1/n)Z^TZ=(1/n)(FA^T)^TFA^T=A((1/n)F^TF)A^T.

Учитывая (3.5), окончательно получим:

(3.10)

Перейдем теперь непосредственно к отысканию собственных значений и собственных векторов корреляционной матрицы R.

Из линейной алгебры известно, что для любой симметрической матрицы R, всегда существует такая ортогональная матрица U, что выполняется условие:

U^TRU= , (3.11)

где,

сти (kk);

– диагональная матрица собственных значений размерно-

размерности (kk).

– ортогональная матрица собственных векторов

Так как матрица R положительно определена, т.е. ее главные миноры положительны, то все собственные значения положительны – _>0 для всех =1,2, ..., К.

В компонентном анализе элементы матрицы  ранжированы ₁₂..._..._>0. Как будет показано ниже, собственное значение  характеризует вклад -й главной компоненты в суммарную дисперсию исходного признакового пространства.

Таким образом, первая главная компонента вносит наибольший вклад в суммарную дисперсию, а последняя k-я – наименьший.

В ортогональной матрице U собственных векторов, -й столбец является собственным вектором, соответствующим _-му значению.

Собственные значения ₁..._..._ находятся как корни характеристического уравнения:

/R- Е / = 0. (3.12)

Собственный вектор V_, соответствующий собственному значению _ корреляционной матрицы R, определяется как отличное от нуля решение уравнения, которое следует из (3.11):

(R -_Е)V_=0. (3.13)

Нормированный собственный вектор U равен:

Из условия ортогональности матрицы U следует, что U^-1=U^Т, но тогда по определению матрицы R и  подобны, так как они согласно (3.11) удовлетворяют условию:

U^-1RU=.

Так как следы, т.е. суммы диагональных элементов у подобных матриц равны, то:

tr=tr(U^-1RU)=tr[R(UU^-1)]=trR.

Напомним из линейной алгебры, что умножение матрицы U на обратную матрицу U^-1, дает единичную матрицу Е. Следы матричных произведений (U^-1)(RU) и R(UU^-1) также равны.

Учитывая, что сумма диагональных элементов матрицы R равна k, будем иметь:

tr=trR=k.

Таким образом,

(3.14 )

Покажем, что матрицу факторных нагрузок А можем представить в виде:

A=UA^1/2. (3.15)

Для этого, умножив выражение (3.11)

Слева на U, а справа на U^T, получим с учетом (3.10):

Учитывая, что U^T=U и UU^T=E имеем:

Из чего следует, что:

A=U

Рассмотрим -й столбец матрицы А:

А=U _^1/2,

где U_ – собственный вектор матрицы R, соответствующий собственному значению _.

Найдем норму вектора А_:

/А_/²⁼А_^ТА_=_^1/2U_^TU__^1/2=_. (3.16)

Здесь учитывалось, что вектор U_ нормированный и U_^ТU_=1. Таким образом,

_=

Сравнив полученный результат с (3.9), можно сделать вывод, что собственное значение _ характеризует вклад -й главной компоненты в суммарную дисперсию всех исходных признаков. Из (3.15) следует:

А^TА= (3.17)

Согласно (3.14) общий вклад всех главных компонент в суммарную дисперсию равен k. Тогда удельный вклад -й главной компоненты определяется по формуле:

Суммарный вклад m первых главных компонент определяется из выражения:

Обычно для анализа используют m первых главных компонент, суммарный вклад которых превышает 60–70%.

Матрица факторных нагрузок А используется для экономической интерпретации главных компонент, которые представляют линейные функции исходных признаков. Для экономической интерпретации f_ используются лишь те x_j, для которых, /а_j_/>0,5.

Значения главных компонент для каждого i-го объекта (i=1,2,...,n) задаются матрицей F.

Матрицу значений главных компонент можно получить из формулы:

Z=FA^T,

откуда,

F=Z(A^T)^-1=ZU^-1,

где,

Z – матрица нормированных значений исходных показателей.

Уравнение регрессии на главных компонентах строится по алгоритму пошагового регрессионного анализа, где в качестве аргументов используются главные компоненты, а не исходные показатели. К достоинству последней модели следует отнести тот факт, что главные компоненты взаимно не коррелированы. При построении уравнений регрессии следует учитывать все главные компоненты.

1 / 41 2 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
23.04.2019276.99 Кб8birzhevoe_delo.doc
#
12.11.2018726.02 Кб4Bizn.plan.doc
#
17.08.201936.06 Кб1Biznes-model_2_1.docx
#
02.09.2019198.32 Кб1blok 1 (1-10).docx
#
02.09.2019248.16 Кб0blok 1 (11-20).docx
#
25.11.2019333.31 Кб0BM_R3.DOC
#
16.03.2015221.94 Кб9Body Language and Interviews.pdf
#
05.12.20183.17 Mб14BOOK0.doc
#
21.09.2019214.02 Кб1bo_s_1_po_30_1 (1).doc
#
21.09.2019150.02 Кб4bo_s_31_po_60_1.doc
#
22.08.2019141.86 Кб2Branding_Konference.docx