- •Часть II
- •Содержание
- •Часть I
- •Часть II
- •Тема 4. Корреляционный анализ § 4.1. Статистическая зависимость
- •§ 4.2. Вычисление коэффициента корреляции по выборке
- •По диаграмме рассеяния.
- •Корреляционная таблица
- •§ 4.3. Свойства и значимость коэффициента корреляции
- •§ 4.4. Коэффициент детерминации
- •§ 4.5. Частный и множественный коэффициенты корреляции
- •Вопросы для самопроверки
§ 4.3. Свойства и значимость коэффициента корреляции
Напомним следующие свойства коэффициента корреляции (см. корреляция в [7]).
1. Коэффициент корреляции – величина безразмерная, следовательно, он сопоставим для различных экономических показателей.
2. rxy изменяется в пределах от -1 до +1.
Значение r = ±1 свидетельствует о функциональной линейной зависимости между Х и Y, так что при данном Х = х значение Y точно определено, rxy = 0 указывает на отсутствие линейной зависимости между Х и Y.
Коэффициент корреляции вычисляется по выборке, поэтому подвержен влиянию случайности. Следовательно, необходимо проверить гипотезу о его значимости, т.е. существенно ли xy отличается от нуля или это отличие можно приписать влиянию случайности, вызванной выборкой.
Сформулируем нулевую и альтернативную гипотезы.
.
В качестве критерия принимается случайная величина
Эта величина при справедливости H0 имеет распределение Стьюдента с n – 2 степенями свободы.
Пример. При изучении себестоимости (Y) и зарплаты (Х) (выборка объема n = 42) rxy = 0,65. Нужно проверить гипотезу о существенности отличия от нуля XY. Положим = 0,05. .
Тнабл > Ткр, гипотеза H0 отвергается.
§ 4.4. Коэффициент детерминации
Величина называется коэффициентом детерминации. Он характеризует, на сколько процентов изменчивость одной переменной можно объяснить изменчивостью другой переменной. Остальные относятся к воздействию других переменных, которые нам неизвестны.
Например, в предыдущей задаче коэффициент корреляции между Y – себестоимостью и Х – зарплатой был равен 0,65. Тогда Kd = 42,25%. Следовательно, 42,25% изменчивости себестоимости продукции объясняется изменчивостью зарплаты. Остальные 57,75% объясняются другими факторами, например, стоимостью покупных комплектующих изделий, стоимостью энергообеспечения, стоимостью материалов и т.д.
Пример. Рассмотрим зависимость между ростом Х (в см) и весом Y (в кг) женщин. Пусть по результатам случайной выборки объема n = 15 получена таблица:
Х |
164 |
161 |
170 |
159 |
161 |
164 |
161 |
170 |
159 |
164 |
161 |
164 |
159 |
161 |
170 |
Y |
65 |
64 |
70 |
60 |
64 |
65 |
64 |
70 |
61 |
68 |
65 |
68 |
61 |
67 |
72 |
Требуется: а) построить диаграмму рассеяния;
б) составить корреляционную таблицу;
в) вычислить условные средние ;
г) вычислить парный коэффициент корреляции rxy и проверить его значимость на уровне значимости = 0,10;
д) вычислить коэффициент детерминации и объяснить его смысл.
Решение. а) Диаграмму рассеяния получим, если нанесем пары значений на координатную плоскость ХОУ.
В скобках указана частота встречаемости значений .
б) Построим таблицу с двумя входами Х и Y. Для каждой переменной составим вариационный ряд. Частоту встречаемости в выборке запишем на пересечении i-ой строки и j-го столбца . Таким образом, получим корреляционную таблицу.
Y X |
60 |
61 |
64 |
65 |
67 |
68 |
70 |
72 |
ni. |
159 |
1 |
2 |
|
|
|
|
|
|
3 |
161 |
|
|
3 |
1 |
1 |
|
|
|
5 |
164 |
|
|
|
2 |
|
2 |
|
|
4 |
170 |
|
|
|
|
|
|
2 |
1 |
3 |
n.j |
1 |
2 |
3 |
3 |
1 |
2 |
2 |
1 |
15 |
Последние строка и столбец содержат итоговые частоты по столбцам (n.j) и строкам (ni.). Сумма частот итоговой строки и столбца равны между собой и и равны объему выборки n = 15.
в) Для каждого значения Х вычислим средние значения Y, т.е. и запишем их в таблицу. Так, для
кг;
кг;
кг;
кг.
Х |
159 |
161 |
164 |
170 |
|
60,6 |
64,8 |
66,5 |
70,7 |
г) Вычислим оценку парного коэффициента корреляции по корреляционной таблице
Итак, .
Для проверки гипотезы против альтернативы вычислим наблюдаемое значение критерия
.
По таблице распределения Стьюдента определим . Так как (7,53 > 2,16), то гипотеза Н0 отвергается, что было очевидно и без проверки гипотезы, т.к. rxy = 0,9.
д) Вычислим коэффициент детерминации = 81%, т.е. изменение веса женщины на 81% зависит от роста, а на 19% зависит от других факторов, которыми могут быть наследственность, состояние здоровья и т.п.