Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭМС Корреляционный анализ.doc
Скачиваний:
15
Добавлен:
10.11.2018
Размер:
1.26 Mб
Скачать

§ 4.3. Свойства и значимость коэффициента корреляции

Напомним следующие свойства коэффициента корреляции (см. корреляция в [7]).

1. Коэффициент корреляции – величина безразмерная, следовательно, он сопоставим для различных экономических показателей.

2. rxy изменяется в пределах от -1 до +1.

Значение r = ±1 свидетельствует о функциональной линейной зависимости между Х и Y, так что при данном Х = х значение Y точно определено, rxy = 0 указывает на отсутствие линейной зависимости между Х и Y.

Коэффициент корреляции вычисляется по выборке, поэтому подвержен влиянию случайности. Следовательно, необходимо проверить гипотезу о его значимости, т.е. существенно ли xy отличается от нуля или это отличие можно приписать влиянию случайности, вызванной выборкой.

Сформулируем нулевую и альтернативную гипотезы.

.

В качестве критерия принимается случайная величина

Эта величина при справедливости H0 имеет распределение Стьюдента с n – 2 степенями свободы.

Пример. При изучении себестоимости (Y) и зарплаты (Х) (выборка объема n = 42) rxy = 0,65. Нужно проверить гипотезу о существенности отличия от нуля XY. Положим  = 0,05. .

Тнабл > Ткр, гипотеза H0 отвергается.

§ 4.4. Коэффициент детерминации

Величина называется коэффициентом детерминации. Он характеризует, на сколько процентов изменчивость одной переменной можно объяснить изменчивостью другой переменной. Остальные относятся к воздействию других переменных, которые нам неизвестны.

Например, в предыдущей задаче коэффициент корреляции между Y – себестоимостью и Х – зарплатой был равен 0,65. Тогда Kd = 42,25%. Следовательно, 42,25% изменчивости себестоимости продукции объясняется изменчивостью зарплаты. Остальные 57,75% объясняются другими факторами, например, стоимостью покупных комплектующих изделий, стоимостью энергообеспечения, стоимостью материалов и т.д.

Пример. Рассмотрим зависимость между ростом Х (в см) и весом Y (в кг) женщин. Пусть по результатам случайной выборки объема n = 15 получена таблица:

Х

164

161

170

159

161

164

161

170

159

164

161

164

159

161

170

Y

65

64

70

60

64

65

64

70

61

68

65

68

61

67

72

Требуется: а) построить диаграмму рассеяния;

б) составить корреляционную таблицу;

в) вычислить условные средние ;

г) вычислить парный коэффициент корреляции rxy и проверить его значимость на уровне значимости  = 0,10;

д) вычислить коэффициент детерминации и объяснить его смысл.

Решение. а) Диаграмму рассеяния получим, если нанесем пары значений на координатную плоскость ХОУ.

В скобках указана частота встречаемости значений .

б) Построим таблицу с двумя входами Х и Y. Для каждой переменной составим вариационный ряд. Частоту встречаемости в выборке запишем на пересечении i-ой строки и j-го столбца . Таким образом, получим корреляционную таблицу.

Y

X

60

61

64

65

67

68

70

72

ni.

159

1

2

3

161

3

1

1

5

164

2

2

4

170

2

1

3

n.j

1

2

3

3

1

2

2

1

15

Последние строка и столбец содержат итоговые частоты по столбцам (n.j) и строкам (ni.). Сумма частот итоговой строки и столбца равны между собой и и равны объему выборки n = 15.

в) Для каждого значения Х вычислим средние значения Y, т.е. и запишем их в таблицу. Так, для

кг;

кг;

кг;

кг.

Х

159

161

164

170

60,6

64,8

66,5

70,7

г) Вычислим оценку парного коэффициента корреляции по корреляционной таблице

Итак, .

Для проверки гипотезы против альтернативы вычислим наблюдаемое значение критерия

.

По таблице распределения Стьюдента определим . Так как (7,53 > 2,16), то гипотеза Н0 отвергается, что было очевидно и без проверки гипотезы, т.к. rxy = 0,9.

д) Вычислим коэффициент детерминации = 81%, т.е. изменение веса женщины на 81% зависит от роста, а на 19% зависит от других факторов, которыми могут быть наследственность, состояние здоровья и т.п.