- •Корреляционный анализ
- •Пример 1
- •Занятие 7. Исследование зависимости признаков методом корреляционного анализа. Коэффициент корреляции. Корреляционное отношение
- •Нулевая гипотеза отвергается на уровне значимости α, если
- •Если гипотеза н0верна, статистикаtимеет асимптотически стандартное нормальное распределение.
- •7.3. Измерение степени тесноты связи при нелинейной зависимости
- •Занятие 8
Нулевая гипотеза отвергается на уровне значимости α, если
(п –2),
где ( п– 2) – квантиль уровня 1 – α/2 распределения Стьюдента сп– 2 степенями свободы.
Пример. Пусть по результатам наблюдения выборки двух переменных объема п = 27 вычислен выборочный коэффициент корреляции = 0,3. Проверить гипотезу об отсутствии корреляции между двумя переменными Н0 : r = 0; Н1 : r0 при уровне значимости = 0,05. Значение статистики критерия равно t = () /= =1,5/=1,572. Критическое значение статистики = 2,06.
Решающее правило имеет вид:
принимается гипотеза Н0, если – 2,06< t < 2,06; принимается гипотеза Н1, если t –2,06 или t2,06.
Так как t = 1,572< 2,06, у нас нет основания отклонить гипотезу Н0. Следовательно, корреляционная связь между исследуемыми переменными отсутствует.
Доверительные интервалы для истинного значения коэффициента корреляции rможно построить, исходя из нормального распределения . Границы интервала r1, r2 можно вычислить по приближенной формуле
r1,2 = + u 1– α/2 ,
где u 1– α/2 – квантильуровня 1 –α/2 стандартного нормального распределения.
Общий случай. Дляпроверки гипотезы об отсутствии корреляционной связи между двумя нормально распределенными переменными Н0 : r = 0; против двусторонней альтернативы Н1 : r0 используется следующее решающее правило: гипотеза Н0 отвергается при уровне значимости ,если>.Критическое значение коэффициента корреляции может быть определено по формуле [14] (Мюллер П..1982кн-ТаблиПМС):
= ,
где – квантиль уровняq распределения Стьюдента с т = п – 2 степенями свободы.
Применение преобразования Фишера
Если коэффициент корреляции rимеет значимое отличие от нуля, то его распределение тем сильнее отличается от нормального, чем меньше объем выборкип и чем больше его абсолютное значение. Распределение выборочного коэффициента корреляции может быть приближенно приведено к нормальному с помощьюпреобразования Фишера
z= 0,5ln(). (7.4)
Фишер показал, что распределение величины z, определяемой соотношением (7.4), прип→ ∞ асимптотически нормально со средним 0,5ln() +и дисперсией 1/ (п–3).
Проверка гипотезы Н0 : r = r0. ГипотезаН0:r= r0≠ 0 (Н1:r≠ r0) о линейном коэффициенте корреляцииrдвумерной нормальной совокупности проверяется по результатам наблюдений выборки (x1,y1), (x2,y2),…, (xn, yn) объемапс помощью статистики
t= (z–ζ0),
где ζ0= 0,5ln() +.
Если гипотеза н0верна, статистикаtимеет асимптотически стандартное нормальное распределение.
При двусторонней альтернативе на уровне значимости α гипотеза Н0отвергается, если>, где– квантиль стандартного нормального распределения уровня 1 – α/2.
Сравнение двух коэффициентов корреляции. ГипотезаН0:r1= r2о равенстве коэффициентов корреляцииr1и r2двух двумерных нормальных совокупностей проверяется по результатам наблюдений двух выборок объемамип1ип2с помощью статистики
t= (z1–z2)/(.
Если гипотеза Н0верна, статистикаtимеет асимптотически стандартное нормальное распределение. При двусторонней альтернативе на уровне значимости α гипотезаН0отвергается, если>, где– квантиль стандартного нормального распределения уровня 1 – α/2.
Проверка гипотезы однородности коэффициентов корреляции. Пусть,, …,– коэффициенты корреляции, полученные изkнормально распределенных совокупностей по выборкам с объемамип1,п2,…, пk. Проверяется гипотеза
Н0:r1= r2= …=rk=r.
Статистика
имеет тогда распределение χ2сkстепенями свободы. Если заменитьzна среднее арифметическое=, то получим, что статистикараспределена по закону χ2с ν =k– 1 степенями свободы.
Если для заданных α и ν = k– 1 выполняется неравенство
χ2(α, k– 1) <,
то гипотеза однородности отвергается с уровнем значимости α. В противном случае гипотеза Н0не отвергается.