- •Корреляционный анализ
- •Пример 1
- •Занятие 7. Исследование зависимости признаков методом корреляционного анализа. Коэффициент корреляции. Корреляционное отношение
- •Нулевая гипотеза отвергается на уровне значимости α, если
- •Если гипотеза н0верна, статистикаtимеет асимптотически стандартное нормальное распределение.
- •7.3. Измерение степени тесноты связи при нелинейной зависимости
- •Занятие 8
7.3. Измерение степени тесноты связи при нелинейной зависимости
Равенство нулю коэффициента корреляциии r еще не доказывает, что между случайными величинами и отсутствует зависимость, которая может быть не только линейной, но и нелинейной. Характеристикой, указывающей не наличие как линейной, так и нелинейной корреляционной зависимости случайных величин и , является корреляционное отношение.
Корреляционное отношение. Рассмотрим случай, когда выборочные данные сгруппированы по оси независимой (объясняющей) переменной. Пусть k – число интервалов группировки по оси абсцисс; mi (i = 1, 2,… k) –число выборочных точек, попавших в i –й интервал группирования; = ()/mi – среднее значение ординат точек, попавших в в i –й интервал группирования.
Корреляционное отношение η представляет собой отношение выборочных оценок межгрупповой дисперсии и дисперсиииндивидуальных результатов наблюдений:
η2 = /,
= 1/ п,= () /п– общее среднее,
= 1/ п.
Величину η принято называть корреляционным отношением зависимой переменной Yпо независимой переменнойX.
Свойства корреляционного отношения.
Если величина Yсвязана с величинойXфункциональной зависимостью, отношение η2= 1, еслиYсвязана с величинойXкорреляционной зависимостью, отношение η2< 1;
0 ≤ η < 1 - с ростом η корреляционная связь становится более тесной;
если η = 0, корреляция между XиYотсутствует, некоррелированностьYсX не влечет за собой некоррелированностиXсY;
если η = 1, величины XиYсвязаны функциональной зависимостью;
η ≥ rXY ;
η = rXY , имеет место линейная корреляционная зависимость.
В отличие от коэффициента корреляции отношение η оценивает тесноту связи любой формы, однако не позволяет судить о разбросе вокруг кривой определенного вида.
Проверка гипотезы об отсутствии корреляционной связи. Пусть условные распределения зависимой переменнойY(х) при любом фиксированномхописываются нормальным законом с постоянной дисперсией σ2.
Проверяется гипотеза Н0: ηXY= 0.
Статистика F=имеет приближенноF– распределение Фишера с (k – 1,n – k) степенями свободы. ЕслиF>(k–1,n– k), то гипотезаН0 об отсутствии корреляционной связи между XиYотвергается с уровнем значимости α. Здесь(k–1,n– k) – квантиль уровня αF– распределения с числом степеней свободы числителяk–1 и знаменателяn– k. При выполнении обратного неравенства значение корреляционного отношения η признается статистически незначимым, т. е. делается вывод об отсутствии корреляционной связи между XиY.
Пример.Проверить гипотезуН0: ηXY= 0 об отсутствии корреляционной связи между двумя переменнымиХиY. Данные для решения задачи представлены в таблице:
Интервал Х |
8– 10 т1 = 3 |
10 – 12 т2 = 3 |
12 –14 т3 = 3 |
14 – 16 т4 = 3 |
16 –18 т5 = 2 |
18 –20 т6 = 3 |
Y |
7,000 11,000 8 |
21,000 25,000 22,000 |
38,000 33,000 43,000 |
48,000 50,000 62,000 |
70,000 74,000 |
84,000 82,000 68,000 |
= 8,663 |
= 22,667 |
= 38,000 |
= 53,333 |
= 72,000 |
= 78,000 | |
= 43,882; п =17 |
Находим = 657,227;= 678,600 и вычисляем значение корреляционного отношения η2=/= 657,227 / 678,600 = 0,9685. Определяем статистикуF== 67,64 и критическое значение(5, 11) = 3,20. Так какF= 67,64 >(5, 11) = 3,20, то гипотезаН0 об отсутствии корреляционной связи между XиYотвергается с уровнем значимости 0,05.