Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм
.pdf-80-
54. Проверка гипотез о законе распределения
Критерий согласия 2 (Пирсона)
До сих пор мы рассматривали гипотезы, относящиеся к отдельным параметрам распределения случайной величины, причём закон распределения предполагался известным. Однако во многих практических задачах закон распределения случайной величины неизвестен, т. е. является гипотезой, которая требует статистической проверки.
Обозначим через X исследуемую случайную величину. Пусть требуется проверить гипотезу H0 о том, что случайная величина
подчиняется закону распределения F (x). Для проверки гипотезы
произведём выборку, состоящую из п независимых наблюдений над случайной величиной X . По выборке можно построить эмпирическое распределение F * (x) исследуемой случайной величины. Срав-
нение эмпирического F * (x) и теоретического распределений производится с помощью специально подобранной случайной величины -
критерия согласия. Существует несколько критериев согласия: 2 Пирсона, Колмогорова, Смирнова и др. Критерий согласия Пирсона - наиболее часто употребляемый критерий для проверки гипотезы о законе распределения.
Рассмотрим этот критерий. Разобьём всю область изменения X на l интервалов ∆1 ,∆2 ,L,∆l и подсчитаем количество элементов
mi , попавших в каждый из интервалов ∆i . Предполагая известным теоретический закон распределения F (x), всегда можно определить pi (вероятность попадания случайной величины X в интервал ∆i ), тогда теоретические частоты можно рассчитать по формуле n pi .
Если эмпирические частоты сильно отличаются от теоретических, то проверяемую гипотезу H0 следует отвергнуть, в противном случае -
принять.
Сформулируем критерий, который бы характеризовал степень расхождения между эмпирическими и теоретическими частотами. В литературе по математической статистике доказывается, что стати-
2 |
(mi −n pi )2 |
имеет распределение |
2 |
с k = l −r −1 |
стика = ∑ |
|
|
n pi
степенями свободы. Здесь r - число параметров распределения F (x).
-81-
Правило применения критерия 2сводится к следующему. Рассчитав теоретические частоты n pi и вычислив значение 2p , затем выбрав
уровень значимости критерия α , по таблице находим 2 (k ;α). Если2p > 2 (k ;α), то гипотезу H0 отвергают, если 2p ≤ 2 (k ;α), то
гипотезу принимают или, другими словами нет оснований отвергнуть гипотезу о том, что генеральная совокупность подчинена закону распределения F (x). В заключение отметим, что необходимым услови-
ем применения критерия Пирсона является наличие в каждом из интервалов по меньшей мере 5-10 наблюдений. Если количество наблюдений мало, то нужно объединить интервалы, содержащие частоты менее 5.
Пример 48. На телефонной станции производились наблюдения над числом X неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: 3; 1; 3; 1; 4; 2; 2; 4; 0; 3; 0; 2; 2; 0; 2; 1; 4; 3; 3; 1; 4; 2; 2; 1; 1; 2; 1; 0; 3; 4; 1; 3; 2; 7; 2; 0; 0; 1; 3; 3; 1; 2; 4; 2; 0; 2; 3; 1; 2; 5; 1; 1; 0; 1; 1; 2; 2; 1; 1; 5. Определить выбо-
рочную среднюю и дисперсию неправильных соединений в минуту и проверить выполнение основного условия для распределения Пуас-
сона[M (x)=σ 2 ]. Найти теоретическое распределение Пуассона и проверить степень согласия теоретического и эмпирического распре-
делений по критерию 2 Пирсона при уровне значимости α = 0,05 . Решение. Упорядочим результаты наблюдений, записав их в
таблицу:
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
mi |
8 |
17 |
16 |
10 |
6 |
2 |
0 |
1 |
Найдём
x = n1 ∑xi mi = 601 (0 8 +1 17 +2 16+3 10+4 6 +5 2 +6 0 +7 1)=2.
Вычислим выборочную дисперсию по формуле S2 = x2 −(x)2, где x2 =n1 ∑xi2 mi =601 (0 8+1 17+4 16+9 10+16 6+25 2+36 0+49 1)=6,1,
-82-
тогда S 2 (x)= 6,1−4 = 2,1. Необходимое условие для распределения
Пуассона практически выполняется. Запишем теоретический закон распределения Пуассона, используя вместо математического ожида-
ния его оценку x : P(m)=2mm!e−2. Найдём теоретические частоты:
′ |
=n P(0)=60 |
20 |
|
e |
−2 |
|
′ |
=n P(1)=60 |
2 |
e |
−2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
m0 |
|
|
|
|
|
|
≈8,1; m1 |
|
|
|
≈16,24; |
|
|
|
|||||||||||||||
0! |
|
|
|
|
1 |
|
|
|
|
||||||||||||||||||||
|
|
22 |
|
|
|
|
|
|
|
|
|
|
23 |
|
|
|
|
|
|
||||||||||
′ |
|
|
|
|
|
−2 |
|
′ |
|
|
|
|
|
|
|
|
|
−2 |
|
|
|||||||||
m2 |
= n P(2)= 60 |
|
|
|
|
e |
|
≈16,24; m3 = n P(3)= 60 |
|
|
|
|
|
e |
|
|
≈10,62 |
; |
|||||||||||
2! |
|
|
3! |
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
′ |
|
|
|
24 |
|
|
−2 |
|
′ |
|
|
|
|
|
25 |
|
|
|
|
−2 |
|
|
|
||||||
m4 |
= n P(4)= 60 |
|
|
|
|
e |
|
≈ 5,41; m5 = n P(5)= |
60 |
|
|
|
|
|
e |
|
|
≈ 2,17 ; |
|
||||||||||
4! |
|
|
5! |
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
m6′ = n P(6)= 60 |
26 |
e |
−2 ≈ 0,72; m7′ = n P(7)= |
60 |
|
27 |
e−2 |
|
≈ 0,2 . |
|
|||||||||||||||||||
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
6! |
|
|
|
|
|
|
|
|
|
|
|
|
7! |
|
|
|
|
|
|
|
|
Так как последних три интервала содержат частоты менее пяти, то объединим их с предыдущим. Получим
|
|
|
|
|
|
|
m i |
8 |
|
17 |
|
16 |
10 |
|
|
9 |
|
|
|
|
|
|
|
|
|
|
m'i |
8,1 |
|
16,2 |
|
16,2 |
10,6 |
|
|
8,5 |
|
|
|
Вычислим значение |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
2 |
|
(mi −mi′ )2 |
(8,1−8)2 |
(17 −16,2)2 |
(16 |
−16,2)2 |
|
|||||||||||
p = ∑ |
mi′ |
= |
|
|
+ |
|
|
|
+ |
|
|
|
|
+ |
|||||
8,1 |
16,2 |
|
|
|
16,2 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
+ |
|
(10 −10,6)2 |
+ |
(9 −8,5)2 ≈ 0,11 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
10,6 |
|
8,5 |
|
|
|
|
|
|
|
|
|
|
|
|
Примем уровень значимости α = 0,05. Количество интервалов после объединения l = 5. По выборке вычислен один параметр, которым определяется закон Пирсона - математическое ожидание, следовательно: r =1. Поэтому число степеней свободы k = l −r −1 = 5 −1−1 = 3. По таблице (см. приложение табл.4) находим
2 (3;0,05)= 7,8. Имеем 7,8>0,11, следовательно, нет оснований от-
вергнуть нулевую гипотезу или, другими словами, при уровне значимости α = 0,05 можно считать, что генеральная совокупность распределена по закону Пуассона.
-83-
Пример 49. Проверить гипотезу о нормальном распределении для следующего интервального ряда:
xi |
12 |
16 |
20 |
24 |
28 |
32 |
mi |
10 |
14 |
22 |
24 |
16 |
14 |
Решение. Найдём выборочное среднее по формуле
x= n1 ∑xi mi =
=1001 (12 10 +16 14 +20 22 +24 24 +28 16 +32 14)= 22,56
и исправленную дисперсию по формуле S)2 = |
n |
|
|
−( |
|
)2 |
|
|
x2 |
, где |
|||||||
x |
||||||||
|
||||||||
|
n −1 |
|
|
|
|
x2 = n1 ∑xi mi =
=1001 (122 10 +162 14 +202 22 +242 24 +282 16 +322 14)=
=545,28 S) =10099 (545,28 −22,562 )≈ 36,693 S) ≈ 6,0575.
Найдём теоретические частоты по формулам:
|
|
n h |
x |
|
− |
|
|
|
12−22,56 |
|
|
||||||
|
|
i |
x |
|
|
|
|||||||||||
m′ |
≈ |
) |
|
ϕ |
|
) |
|
≈ 66 |
ϕ |
|
= 66 ϕ(1,74)≈ 66 |
0,0878 |
≈5,8, |
||||
|
|
|
|
||||||||||||||
1 |
|
S |
|
|
|
S |
|
|
|
6,0575 |
|
|
|||||
|
|
|
|
|
|
|
|||||||||||
′ |
|
|
|
16−22,56 |
≈ 66 ϕ(1,08)≈ 66 0,2227≈14,7, |
|
|
||||||||||
m2 |
≈ 66 ϕ |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
6,0575 |
|
|
|
|
|
|
||||||
m3′ |
|
|
|
|
20 −22,56 |
≈ 66 ϕ(0,42)≈ 66 0,3652 ≈ 24,1, |
|
||||||||||
≈ 66 ϕ |
|
|
|
|
|
|
|
|
|||||||||
|
6,0575 |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
m4′ ≈ 66 ϕ 24 −22,56 ≈ 66 ϕ(0,24)≈ 66 0,3876 ≈ 25,6,
6,0575
m5′ |
|
28 −22,56 |
|
|
≈ 66 ϕ(0,90)≈ 66 0,2661 ≈17,6, |
|
≈ 66 ϕ |
|
|
|
|||
6,0575 |
||||||
|
|
|
|
|
||
m6′ |
|
32 −22,56 |
|
|
≈ 66 ϕ(1,56)≈ 66 0,1182 ≈ 7,8. |
|
≈ 66 ϕ |
|
|
|
|||
6,0575 |
|
|||||
|
|
|
|
|
-84-
Найдём 2p по формуле
|
2 |
|
(mi − mi′ )2 |
|
(10 − |
5,8)2 |
|
(14 −14,7)2 |
|
(22 |
− 24,1)2 |
|
|||||
p = ∑ |
mi′ |
= |
|
|
|
+ |
|
|
+ |
|
|
+ |
|||||
5,8 |
14 |
,7 |
|
24,1 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||
+ |
|
(24 − 25,6)2 |
+ |
(16 −17,6)2 |
|
+ (14 −7,8)2 |
≈ 8,43 |
|
|
|
|||||||
|
|
|
|
|
|
|
|||||||||||
|
|
|
25,6 |
|
|
17,6 |
|
|
7,8 |
|
|
|
|
|
Число степеней свободы равно 6-3=3, следовательно, при уровне значимости α = 0,05 имеем по таблице 2кр(3;0,05)= 7,8 , а при уровне
значимости α = 0,01 имеем по таблице 2кр(3;0,01)=11,3. Таким образом, при уровне значимости α = 0,05 нулевую гипотезу отвергаем, а при уровне значимости α = 0,01 у нас нет оснований отвергнуть нулевую гипотезу.
55.Выборочный коэффициент корреляции и его свойства
Вреальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияние каждого из них ничтожно, а число их велико. В этом случае связь теряет свою однозначность, и изучаемая физическая система переходит не в определенное состояние, а в одно из возможных для неё состояний. Здесь речь может идти лишь о статистической связи. Знание статистической зависимости между случайными переменными имеет большое практическое значение: с её помощью можно прогнозировать значение случайной переменной в предположении, что независимая переменная примет определённое значение.
Статистические связи между переменными можно изучать методом корреляционного и регрессионного анализа. Основная задача корреляционного анализа - выявление связи между случайными переменными путём точечной и интервальной оценки парных коэффициентов корреляции, вычисления и проверки значимости коэффициентов корреляции. Корреляционный анализ позволяет оценить функцию регрессии одной случайной величины на другую. Предпосылки корреляционного анализа следующие: 1) переменные величины должны быть случайными; 2) случайные величины должны иметь нормальное распределение.
Выборочный коэффициент корреляции находится по формуле
-85-
rв = ∑(xi −(x)) (y(i −) y)
n S x S y
Выборочный коэффициент корреляции оценивает тесноту линейной связи.
Свойства выборочного коэффициента корреляции:
1. Коэффициент корреляции принимает значения на интервале
[−1;1].
Доказательство. Докажем справедливость утверждения для дискретных переменных. Запишем явно неотрицательное выражение
|
1 n xi − x |
|
|
yi − y |
2 |
|
|
|
|
|
|
||||
|
|
i∑=1 |
|
± |
|
|
|
≥ 0 . Возведём выражение под знаком сум- |
|||||||
|
n |
S(x) |
|
S(y) |
|||||||||||
|
|
|
|
|
1 n (xi − x)2 |
|
2 n (xi − x)(yi − y) |
|
1 n (yi − y)2 |
||||||
мы в квадрат |
|
i∑=1 S 2 (x) |
± |
|
i∑=1 S(x)S(y) |
+ |
|
i∑=1 S 2 (y) . |
|||||||
n |
n |
n |
Первое и третье слагаемые равны единице по определению дисперсии. Таким образом: 1±rв +1 ≥ 0, откуда −1 ≤ rв ≤1.
2. Выборочный коэффициент корреляции не зависит от выбора
|
начала точки отсчёта и единицы измерения, то есть для любых |
|||||||||||||||||||||
|
a1 ,b1 ,a2 ,b2 выполнено равенство |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
rв(a1x +b1 ;a2 x +b2 )= rв(x; y). |
|
||||||||||||||
3. |
Выборочный коэффициент |
можно |
|
вычислять по формуле |
||||||||||||||||||
|
r |
= |
xy − x y |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
S(x)S(y) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
в |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
Доказательство. По определению |
|
|
|
|
|
|
|||||||||||||
|
|
|
1 |
∑(xi − x)(yi |
− y) |
1 |
(∑xi yi − x∑ yi − y∑xi +n x y) |
|
||||||||||||||
|
|
|
|
|
|
|||||||||||||||||
r |
= |
n |
|
|
|
|
= |
n |
|
|
|
|
|
|
|
= |
||||||
|
|
|
|
|
|
|
S(x)S(y) |
|||||||||||||||
в |
|
|
|
|
S(x)S(y) |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
− x y − x y + x y |
|
|
|
− x y |
|
|||||||
|
|
|
|
|
|
|
|
|
xy |
|
xy |
|
||||||||||
|
|
|
|
|
|
|
= |
|
|
|
|
|
= |
|
. |
|
||||||
|
|
|
|
|
|
|
|
|
|
S(x)S(y) |
|
S(x)S(y) |
|
Пример 50. Вычислить выборочный коэффициент корреляции по следующим данным:
xi |
2 |
2 |
3 |
5 |
yi |
4 |
6 |
6 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-86- |
|
|
|
|
|
|
|
|
|||
|
|
Решение. Вычислим x = |
1 |
|
∑xi = |
1 |
(2 +2 +3 +5)= 3; |
|||||||||||||||||||||||
|
|
n |
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
1 |
|
|
4 |
|
|
|
1 |
|
|||||||||
|
|
|
|
|
|
|
= |
∑x2 = |
(4 +4 +9 +25)=10,5; y = |
(4 +6 +6 +8)= 6; |
||||||||||||||||||||
|
|
|
|
x2 |
||||||||||||||||||||||||||
|
|
|
|
n |
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
i |
4 |
|
|
|
|
|
|
|
|
|
4 |
|
||||||||
|
= |
|
1 |
(16 +36 +36 +64)= 38; |
|
= |
1 |
∑xi |
yi = |
1 |
(8 +12 +18 +40)=19,5; |
|||||||||||||||||||
y2 |
||||||||||||||||||||||||||||||
|
xy |
|||||||||||||||||||||||||||||
4 |
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
4 |
|
|
||||||||||
S 2 (x)= |
x2 |
− x2 =10,5 −9 =1,5; S 2 (y)= |
y2 |
− y2 = 38 −36 = 2; |
||||||||||||||||||||||||||
|
|
|
|
|
|
− x y |
=19,5 −18 = 1,5 ≈ 0,866. |
|||||||||||||||||||||||
r = |
|
|
|
|
xy |
|||||||||||||||||||||||||
в |
|
|
S 2 (x)S 2 (y) |
3 |
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
56. Метод вычисления выборочного коэффициента корреляции для вариационных рядов
Для вычисления выборочного коэффициента корреляции строят корреляционную таблицу. Для этого разбиваем каждый вариационный ряд на интервальный. Затем находятся входящие в формулу для вычисления выборочного коэффициента корреляции параметры.
Пример 51. По данным наблюдений над случайными величинами X и Y получена выборка, приведённая в таблице
№ X |
Y № X |
Y № X |
Y № X |
Y |
|||||||
1 |
7,1 |
10,0 |
14 |
14,8 |
35,3 |
27 |
10,9 |
18,2 |
40 |
16,1 |
30,1 |
2 |
9,5 |
6,7 |
15 |
17,2 |
36,3 |
28 |
11,4 |
18,7 |
41 |
18,2 |
27,2 |
3 |
11,0 |
14,0 |
16 |
19,2 |
37,4 |
29 |
12,3 |
17,6 |
42 |
19,1 |
30,9 |
4 |
12,3 |
15,1 |
17 |
22,3 |
38,0 |
30 |
13,2 |
18,1 |
43 |
17,9 |
35,1 |
5 |
11,8 |
24,2 |
18 |
17,2 |
40,2 |
31 |
13,1 |
24,1 |
44 |
18,7 |
36,1 |
6 |
14,1 |
19,9 |
19 |
19,9 |
42,4 |
32 |
13,6 |
21,3 |
45 |
12,4 |
17,6 |
7 |
15,1 |
24,3 |
20 |
20,1 |
44,5 |
33 |
13,7 |
19,8 |
46 |
12,5 |
18,6 |
8 |
14,7 |
22,2 |
21 |
21,7 |
42,4 |
34 |
14,6 |
24,1 |
47 |
12,7 |
19,2 |
9 |
16,1 |
21,0 |
22 |
8,5 |
12,2 |
35 |
14,2 |
21,3 |
48 |
14,1 |
26,2 |
10 |
13,1 |
30,1 |
23 |
9,7 |
12,4 |
36 |
15,2 |
25,2 |
49 |
14,6 |
27,4 |
11 |
13,8 |
28,1 |
24 |
10,2 |
12,5 |
37 |
16,1 |
21,1 |
50 |
14,9 |
30,1 |
12 |
16,9 |
30,3 |
25 |
11,1 |
12,9 |
38 |
17,2 |
24,6 |
|
|
|
13 |
19,1 |
27,3 |
26 |
11,3 |
16,1 |
39 |
18,0 |
23,3 |
|
|
|
Найдём оптимальные длины интервалов и количество интервалов, используя формулу Стэрджеса. Для переменной Х наименьшее значение - 7,1 наибольшее - 22,3, тогда оптимальное число интервалов равно 7 с шагом, равным 2,2, при этом получаем такие интервалы:
[7,1;9,3),[9,3;11,5),[11,5;13,7),[13,7;15,9), [15,9;18,1),
-87-
[18,1;20,3), [20,3;22,5). Для переменной У минимальное значение - 6,7
наибольшее - 44,5, тогда оптимальное число интервалов 6 с шагом, равным 6,3. Получаем интервалы
[6,7;13,0), [13,0;19,3),[19,3;25,6),[25,6;31,9), [31,9;38,2),[38,2;44,5]. Рас-
пределим наблюдения по полученным интервалам получим корреляционную таблицу. В таблицу вместо интервалов запишем их середины
У |
|
|
|
Х |
|
|
|
ny |
|
8,2 |
10,4 |
12,6 |
14,8 |
17,0 |
19,2 |
21,4 |
|||
|
|
||||||||
9,85 |
2 |
4 |
|
|
|
|
|
6 |
|
16,15 |
|
4 |
6 |
|
|
|
|
10 |
|
22,45 |
|
|
3 |
7 |
4 |
|
|
14 |
|
28,75 |
|
|
1 |
4 |
2 |
3 |
|
10 |
|
35,05 |
|
|
|
1 |
2 |
2 |
1 |
6 |
|
41,35 |
|
|
|
|
1 |
1 |
2 |
4 |
|
nx |
2 |
8 |
10 |
12 |
9 |
6 |
3 |
50 |
Для упрощения |
|
расчётов |
перейдём |
к |
условным |
вариантам |
||||||||||||||||||||||||
ui = |
|
xi −C x |
= |
|
xi −14,8 |
и vi = |
yi −C y |
= |
|
yi −22,45 |
. |
Составим рас- |
||||||||||||||||||
|
|
|
hx |
|
2 |
,2 |
|
|
hy |
|
|
6,3 |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
чётную таблицу. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
U |
|
|
|
|
|
|
|
|
|
nv |
|
vi nv |
nvvi2 |
|
|||
|
|
|
|
-3 |
|
|
-2 |
|
-1 |
|
0 |
|
1 |
|
2 |
|
|
|
3 |
|
|
|
||||||||
-2 |
|
|
|
|
2 |
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
-12 |
|
24 |
|
||
-1 |
|
|
|
|
|
|
|
4 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
-10 |
|
10 |
|
||
0 |
|
|
|
|
|
|
|
|
|
|
3 |
|
7 |
|
4 |
|
|
|
|
|
|
|
14 |
|
|
0 |
|
0 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
1 |
|
4 |
|
2 |
|
3 |
|
|
|
|
|
10 |
|
|
10 |
|
10 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
|
2 |
|
|
|
1 |
|
6 |
|
|
12 |
|
24 |
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
1 |
|
|
|
2 |
|
4 |
|
|
12 |
|
36 |
|
|
nu |
|
|
|
|
2 |
|
|
8 |
|
10 |
12 |
|
9 |
|
6 |
|
|
|
3 |
|
50 |
|
|
12 |
|
104 |
|
|||
nuui |
|
-6 |
|
|
-16 |
-10 |
0 |
|
9 |
|
12 |
|
|
9 |
|
|
|
|
-2 |
|
|
|
||||||||
nuui2 |
|
18 |
|
|
32 |
|
10 |
0 |
|
9 |
|
24 |
|
|
27 |
|
|
|
|
120 |
|
|
|
|||||||
v |
i |
|
|
|
|
-2 |
|
|
-1,5 |
|
-0,5 |
0,5 |
|
1 |
|
53 |
|
|
83 |
|
|
|
|
|
|
|
|
|||
nuui |
v |
i |
|
12 |
|
|
24 |
|
5 |
|
0 |
|
9 |
|
20 |
|
|
24 |
|
|
|
|
94 |
|
|
|
-88-
Для вычисления выборочного коэффициента корреляции используем
формулу |
r |
|
|
= |
|
uv −u |
v |
, |
|
где |
u = |
1 |
∑n |
u |
= |
1 |
(−2)= −0,04; |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в |
|
|
|
|
|
S2(u)S2(v) |
|
|
|
|
|
|
n |
|
u |
i |
50 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
120 |
|
|
|
|
|
|
|
|
|
|
|
2,4 −(−0,04)2 ≈1,549; |
|||||||||||||||||
|
|
|
= |
∑n u2 = |
= 2,4; |
|
S(u)= u2 |
−u2 = |
|
|||||||||||||||||||||||||||||||||||||
u2 |
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
n |
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
u |
i |
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
12 |
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
104 |
=2,08; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
v |
= |
|
=0,24; v |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
94 |
|
||||||||||
|
S(v)= |
|
|
|
v2 |
−( |
v |
)2 = |
|
|
2,08−0,242 ≈1,422; |
|
|
= |
∑nuui |
v |
i = |
=1,88; |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
uv |
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n |
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
−u |
v |
|
|
|
|
|
1,88 +0,04 0,24 |
|
|
|
|
|
|
|
|
|
|
50 |
|
||||||||||||||||||
r = |
|
uv |
|
|
≈ |
|
≈ 0,854. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
S(u)S(v) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
в |
|
|
|
|
|
|
1,549 1,422 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
57. Проверка гипотезы о значимости коэффициента корреляции
На практике коэффициент корреляции r обычно неизвестен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции rв. Равенство нулю выборочного
коэффициента корреляции ещё не свидетельствует о равенстве нулю самого коэффициента корреляции, а следовательно, о некоррелированности случайных величин Х и У. Чтобы выяснить, находятся ли случайные величины в корреляционной зависимости, нужно проверить значимость выборочного коэффициента корреляции rв, то есть
установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи. Для этого проверяют нулевую гипотезу H0 : r = 0. Предполагается наличие двухмерного нормального
распределения случайных переменных; объём выборки может быть
любым. Вычисляют статистику t = r |
n −2 |
, которая имеет распре- |
в |
1−r 2 |
|
|
в |
|
деление Стьюдента с k = n −2 степенями свободы. Для проверки нулевой гипотезы по уровню значимости α и числу степеней свободы k находят по таблице распределения Стьюдента критическое значе-
-89-
ние tα ,k . Если t ≥ tα ,k , то нулевую гипотезу об отсутствии корреля-
ционной связи между переменными Х и У следует отвергнуть. Переменные считают зависимыми. При t < tα ,k , нет оснований отверг-
нуть нулевую гипотезу.
В случае значимого выборочного коэффициента корреляции есть смысл построить доверительный интервал для коэффициента корреляции r . Однако для этого нужно знать закон распределения выборочного коэффициента корреляции rв. Плотность вероятности
выборочного коэффициента корреляции имеет сложный вид, поэтому прибегают к специально подобранным функциям от выборочного коэффициента корреляции, которые сводятся к хорошо изученным распределениям, например к нормальному или Стьюдента. Чаще всего для подбора функции применяют преобразование Фишера. Вычис-
|
|
1 |
|
1 |
+rв |
|
|
|
||
ляют статистику |
z = |
|
|
, где rв = th z |
- гиперболический тан- |
|||||
|
|
|
|
|||||||
|
1 |
|
||||||||
2 ln |
−r |
|||||||||
|
|
|
|
|
|
в |
|
|
генс от z . Распределение статистики z хорошо аппроксимируется
нормальным |
|
|
|
|
|
распределением |
|
|
с |
|
параметрами |
|||||||||||||
M (z)= |
1 |
|
1 |
+r |
|
|
r |
|
σ 2 |
|
1 |
|
|
|
|
|
|
|
||||||
|
|
ln |
|
|
|
|
|
+ |
|
|
|
, |
= |
|
|
|
. В этом случае доверитель- |
|||||||
2 |
1 |
|
2(n −1) |
n − |
3 |
|||||||||||||||||||
|
|
−r |
|
|
z |
|
|
|
|
|
|
|||||||||||||
ный интервал для r |
имеет вид th z1 < r < th z2 . Величины z1 и z2 на- |
|||||||||||||||||||||||
ходятся по формулам z = 1 ln1+rв − |
|
|
zα ; z |
2 |
= 1 ln1+rв + |
zα |
, |
|||||||||||||||||
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
1 |
−r |
|
|
n −3 |
2 1−r |
n −3 |
|||
|
|
|
|
|
|
1 |
−α |
|
|
|
|
|
|
|
|
в |
|
|
|
|
в |
|
|
|
где Ф(z |
)= |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
α |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пример 52. Проверить значимость выборочного коэффициента корреляции из примера 51 и найти доверительный интервал с надёж-
ностью 0,95 для него. |
|
|
|
|
|
|
Решение. Для |
проверки значимости |
найдём |
статистику |
|
t = r |
n −2 = 0,854 |
48 |
≈11,37 . По |
уровню |
значимости |
в |
1−r 2 |
1−0,8542 |
|
|
|
|
в |
|
|
|
|
α = 0,05 и числу степеней свободы k = 48 найдём tα ,k = 2,009 (см. приложение табл.3). Так как t ≥ tα ,k , то нулевую гипотезу об отсут-
ствии корреляционной связи между переменными Х и У следует отвергнуть. Следовательно, выборочный коэффициент корреляции зна-