Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭМС Корреляционный анализ.doc
Скачиваний:
15
Добавлен:
10.11.2018
Размер:
1.26 Mб
Скачать

§ 4.5. Частный и множественный коэффициенты корреляции

Пусть имеется не две, а больше переменных. Обозначим их X1, X2, …, Xm . Например

Х1 – себестоимость продукции (в млрд. руб.),

X2 – заработная плата (в млрд. руб.),

X3 – стоимость покупных комплектующих изделий,

X4 – стоимость энергообеспечения и т.д.

Тогда, если вычислить парные выборочные коэффициенты корреляции между всеми переменными попарно, то получим квадратную симметричную матрицу R размера m х m, которая называется корреляционной.

Корреляционная матрица R используется для вычисления частного и множественного коэффициентов корреляции.

Частный коэффициент корреляции. Если объекты анализируются по множеству переменных X1, X2, …, Xm, то парные коэффициенты корреляции могут не отражать правильную взаимосвязь между ними. Замечено, что иногда сильная корреляционная зависимость между двумя переменными вызывается не реально существующей между ними зависимостью, а действием на обе переменные в одном направлении третьей переменной (или нескольких) переменных. В связи с этим возникает необходимость исключить влияние этого третьего фактора и получить «очищенное» значение коэффициента корреляции. Это достигается вычислением частных коэффициентов корреляции по формуле (при условии, что исследуемые случайные величины X1, X2, …, Xm подчиняются многомерному нормальному закону) [1].

где Rij – алгебраическое дополнение к элементу rij корреляционной матрицы R (для упрощения в формуле оставлены лишь индексы переменных), а Z – множество переменных без xi и yi.

Рассмотрим частный случай, когда n = 3, т.е. имеются переменные Х1, Х2, Х3. Тогда

Пример. Пусть Х1 – зарплата, Х2 – себестоимость продукции, Х3 – оплата за материалы. По выборке объема n = 60 вычислены парные коэффициенты корреляции: r12 = 0,92; r13 = 0,79; r23 = 0,83, а также частные: r12.3 = 0,78; r13.2 = 0,09; r23.1 = 0,45. Из приведенных данных видно, что зависимость между Х1 и Х3 вызвана воздействием переменной Х2 – себестоимостью продукции. Если ее исключить, то получим r13.2 = 0,09, т.е. между Х1 и Х3 практически не существует линейной зависимости.

Множественный коэффициент корреляции

является мерой линейной зависимости между одной переменной Хi и множеством переменных .

Вычисляется по формуле

,

где det R – определитель матрицы R.

Rii – алгебраическое дополнение к элементу rii корреляционной матрицы R.

Пусть m = 3, т.е. имеются три переменные Х1, Х2, Х3. Положим i = 1, тогда , т.е. необходимо вычислить множественный коэффициент корреляции между Х1 и переменными Х2, Х3.

Множественный коэффициент корреляции изменяется от 0 до 1. Нулевое значение этого коэффициента указывает, что Xi не зависит линейно от множества переменных, входящих в Z. Чем ближе множественный коэффициент корреляции к единице, тем сильнее линейная зависимость, а значение, равное единице, указывает на функциональную линейную зависимость, например, .

По данным предыдущего примера вычислим множественный коэффициент корреляции

Итак, парный коэффициент корреляции между себестоимостью и зарплатой r21 = 0,92, а R2.13 = 0,959, т.е. зависимость себестоимости от зарплаты и оплаты за материалы близка к функциональной.