uchebnik10
.pdfобъема выборки, что важно в практической работе исследовате
ля, так как довольно часто приходится группировать сравни
тельно небольшие выборки (n::;;; 50), что не учитывает рекомен дация Юла - Кендэла 1.
Как и другие статистические характеристики, вычисляемые
с предварительной группировкой исходных данных в вариацион
ные ряды, коэффициент корреляции определяют разными спосо бами, дающими совершенно идентичные результаты.
Способ произведений. Коэффициент корреляции можно вы
числить используя основные формулы (144) или (145), внеся
в них поправку на повторяемость вариант в димерной совокуп
ности. При этом, упрощая символику, отклонения вариант от их
средних обозначим через а, т. е. ах= (Xi-X) и ау= (Yi-jj).
Тогда формула (145) с учетом повторяемости отклонений примет
следующее выражение:
(152)
Очевидно, что для определения коэффициента корреляции этим
способом необходимо предварительно рассчитать средние ариф
метические Х и у, а также величины 2.fxa2x, 2.fya2y и 2.fxyaxay.
Прuм.ер 3. При проведении осеннего кросса на 10-километро
вую дистанцию и лыжных гонок спортсменов на дистанцию 5 км
были получены результаты, которые сведены в табл. 99. Эти дан
ные, выраженные в минутах, указывают на положительную зави
симость между переменными У и Х, где через У обозначены ре зультаты лыжных гонок, а через Х - результаты 10-километро
вого кросса.
Вычислим коэффициент корреляции для этих данных. Пред·
варительно рассчитаем вспомогательные величины (см. «крылья»
таблицы). Находим средние арифметические рядов Х и У:
х = 2.xfx/n = 2391/60=39,85 мин и y=2.yfy/n = 1088/60 =
= 18,13 мин. Умножая квадраты отклонений вариант от их сред них на соответствующие частоты, получаем величины fxa2x и fya2 y. Например, величина fxa2x=26,52 получена следующим об·
1 По данному вопросу существует и другое мнение. Соrласно ему, един
ственным соображением, которое следует Y'lHTblBaTb прн построеннн корреля· цнонной таблнцы для вычнслнтельных целей, является возможность выиrры· ша в объеме вычисленнй при сохраненин нх достаточной точностн. Этому тре·
бованию удовлетворяет условне 15.;;;; К.;;;;25, которое близко к рекомендации
д. Юла и М. Кендэла. Прн К>25 объем вычнсленнй по корреляцнонной таб
лнце необоснованно возрастает, не приводя к существенному повышению нх
точности, прн K<15 может значнтельно уменьшиться точность вычнсленнЙ.
(Прu},!. ред.)
219
разом: в первой верхней строке корреляционной решетки нах(··
дятся 'х= 1 и ax=5,15, откуда 'ха2х= 1·5,152=26,52 и т. д.
Наибольшего внимания и усилий требует |
расчет значеНИI. |
|
'хиахау. Эти значения получаются в результате |
перемножениs: |
|
частот 'хи на соответствующие отклонения |
по |
рядам У и ". |
(обязательно с учетом знаков отклонениЙI). Например, величию:
:щхуахау=40,68 получена следующим образом:
2· (-1,85)· (-2,13) ... 7,881 2· (-2,85)· (-2,13) =12,141 2· (-4,85)· (-2,13) =20,662
f"'иа.,аи""40,683 ~ 40,68
|
|
|
|
|
|
|
|
|
Табllица 9'" |
|
~Y 16 . |
17 |
18 |
19 |
20 |
21 |
'" |
xf" |
".. |
f..а2" |
|
|
|
|
|
|
|
|
|
|
|
|
45 |
|
|
|
1 |
|
1 |
1 |
45 |
+5,15 |
26,52 |
44 |
|
|
|
1 |
|
2 |
88 |
+4,15 |
34,45 |
|
43 |
|
|
1 |
2 |
1 |
2 |
6 |
258 |
+3,15 |
59,54 |
42 |
|
12 |
1 |
1 |
3 |
2 |
7 |
294 |
+2,15 |
32,36 |
41 |
|
1 |
3 |
1 |
|
7 |
287 |
+1,15 |
9,28 |
|
40 |
|
3 |
4 |
1 |
|
|
8 |
320 |
+0,15 |
0,18 |
39 |
2 |
3 |
8 |
1 |
|
|
12 |
468 |
-0,85 |
8,67 |
38 |
4 |
1 |
1 |
|
|
8 |
304 |
-185 |
27,38 |
|
|
3 |
|
|
|
|
, |
|
|||
37 |
2 |
|
|
|
|
5 |
185 |
-285, |
40,61 |
|
36 |
2 |
2 |
|
|
|
|
2 |
72 |
-3,85 |
29,65 |
35 |
|
|
|
|
|
2 |
70 |
-485 |
47,04 |
|
|
|
|
|
|
|
|
, |
|
||
Йи |
6 |
17 |
16 |
10 |
6 |
5 |
60 |
2391 |
- |
315.66 |
96 |
289 |
288 |
190 |
120 |
105 |
1088 |
|
|
|
|
а, |
-2,13 |
-1,13 -0,13 +0,87 +1,87 +2,87 |
- |
|
|
|
||||
f"а2,1 |
27,22 |
21,71 |
0,27 |
7,57 |
20,98 |
41,18 |
118,93 |
|
|
|
''''иа",аи 40,68 |
26,50 |
0,21 |
11,75 |
27,86 |
45,20 |
152,20 |
|
|
|
|
Аналогичным способом рассчитана |
следующая |
велИчИю. |
'хиахау:
2· (+1,15)· (-1,13) =-2,5990 |
} |
-3,1075 |
||
3· (+0,15)· (-1,13) |
=0,5085 |
|||
|
|
|||
3· (-0,85)· (-1,13) |
= +2,8815 |
|
|
|
4· (-1,85)· (-1,13) |
= +8,3620 |
} |
+29,6060 |
|
3· (2.85)· (-1,13) =+9,6615 |
||||
|
|
|||
2· (-3,85)· (-1,13) =+8,7010 |
|
|
'",иа.,аи= +26,4985~ 26,50
И так далее, пока не будут определены все значения 'хиахау ко{\ реляционной таблицы по столбцам или по ее строкам. Суммируs:
220
значения ,"уа"ау, получаем величину ~,"уа"ау= 152,20. Подстав
ляя известные величины в формулу, находим
152,20 |
152,20 |
+0,786. |
|
у 315,66·118,93 |
193,70 |
||
|
Это довольно высокий показатель связи между переменными У
и Х. Достоверность этого показателя оценивается с помощью кри
терия Стьюдента, который представляет отношение выборочного
коэффициента корреляции к своей ошибке, определяемой по
формуле
(153)
Так, в данном случае Г"у=0,786 и n=60. Ошибка 5т==
= УI y-~~786)2 0,080. Отсюда tф= 0,786/0,080 =9,83. Эта величи
на значительно превышает tst=3,46 для k=58 и а=О,1 % (см.
табл. V Приложений) , что опровергает Но-гипотезу на высоком
уровне значимости (Р<О,ОО1).
Способ условных средних. При вычислении коэффициента
корреляции отклонения вариант («классов») можно находить не
только от средних арифметических х и у, но и от условных сред
них А" и Ау. При этом способе в числитель формулы (145) вно
сят поправку и формула приобретает следующий вид:
к
~ f xgaxfLy - nЬхЬУ
rху = |
1-1 |
(154) |
-=-..:;...-~---- , |
nSxsg
где 'хичастоты классов одного и другого рядов распределения;
y |
|
01 |
а,,= (Xi-A,,) /л" и ау= (Yi-A )/ли, т. е. |
отклонения классов |
|
условных средних, отнесенные к величине классовых интервалов
Л; n - общее число парных наблюдений, или объем выборки;
Ь,,=Щхах/n и Ьу=Щуау/n -условные моменты первого поряд
ка, где'" - частоты ряда Х, а 'у - частоты ряда У; 5" и 5у -
средние квадратические отклонения рядов Х и У; они вычисля Ются по способу условных средних, но без умножения на величи
ну классового интервала Л и без внесения поправки n/ (n-l). Способ условных средних имеет преимущество перед спосо
бом произведений, так как позволяет избегать операции с дроб
ными числами и придавать один и тот же (положительный) знак
отклонениям ах и аи, что упрощает технику вычислительной ра
боты, особенно при наличии многозначных чисел.
Прuм.ер 4. Воспользуемся только что рассмотренными дан ными из примера 3 и вычислим коэффициент корреляции между результатами осеннего 10-километрового кросса и ~-километро-
221
вого пробега спортсменов. Как и в предыдущем случае, предв~,
рительно рассчитываем вспомогательные величины (табл. 100.
Подсчитав частоты (х и (у по каждому ряду, намечаем УСЛОF< ные средние Ах и Ау. В качестве этих величин могут быть ВЗЯТh любые классовые варианты. Удобнее брать в качестве условны; средних Ах и Ау значения первых (начальных) классов, тогда BC~
отклонения ах и ау получают положительный знак.
|
|
|
|
|
|
|
|
|
|
|
ТаБJlица 101 |
|
,~- |
16 |
|
17 |
18 |
19 |
20 |
|
21 |
'" |
ах |
t"a" |
f"a'l" |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
||
45 |
|
|
|
|
|
|
|
1 |
1 |
10 |
10 |
100 |
44 |
|
|
|
|
1 |
1 |
|
|
2 |
9 |
18 |
162 |
43 |
|
|
|
1 |
2 |
1 |
|
2 |
6 |
8 |
48 |
384 |
42 |
|
|
|
1 |
1 |
3 |
|
2 |
7 |
7 |
49 |
343 |
41 |
|
|
2 |
1 |
3 |
1 |
|
|
7 |
6 |
42 |
252 |
40 |
|
|
3 |
4 |
1 |
|
|
|
8 |
5 |
40 |
200 |
39 |
|
|
3 |
8 |
1 |
|
|
|
12 |
4 |
48 |
192 |
38 |
2 |
|
4 |
1 |
1 |
|
|
|
8 |
3 |
24 |
72 |
37 |
2 |
|
3 |
|
|
|
|
|
5 |
2 |
10 |
20 |
38 |
|
|
2 |
|
|
|
|
|
2 |
1 |
2 |
2 |
35 |
2 |
|
|
|
|
|
|
|
2 |
О |
О |
О |
{" |
б |
|
17 |
16 |
10 |
6 |
I |
5 |
60 |
- |
-291 |
1727 |
а" |
О |
|
1 |
2 |
3 |
4 |
5 |
- |
|
|
|
|
|
|
|
|
|
||||||||
f"а" |
О |
|
17 |
32 |
30 |
24 |
|
25 |
128 |
|
|
|
f"а,,2 |
О |
I |
17 |
641 |
90 |
96 |
|
125 |
392 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
f""а"а" |
О |
|
59 |
152 |
186 |
176 |
|
200 |
773 |
|
|
|
в данном случае намечаем: Ах=35 и Ау= 16. От этих услор·
ных средних, где ах=О и ау=О, откладываем отклонения клаl
сов, как показано в табл. 100. Перемножая част~ты рядов на o~
клонения классов, находим (хах и (уау, а также (хах2 и fyai. ЗНа
чения (хуахау рассчитываем так же, как и в предыдущем пример~
Так, величина (хуахау=59 получена следующим образом:
f""а"а,,;
2·6·1=12
3·5·1=15
3·4·1=12
4·3·1=12 3·2·1= б 2·1·1= 2
Сумма =59 и т. Д. •
222
)пределяем Ьх=291/60=4,850 и Ьу=128/60=2,133, а также
-редние квадратические отклонения: sx= V 1127/60 -(4,850)2=
=у 5,26=2,294 и sу=УЗ92/60-(2,133)2=VС984= 1,408.
10дставляем известные величины в формулу (154) и определяем
:оэффициент корреляции:
773 - 60 -4, 850·2,133 |
152,30 |
+0,786. |
r "У = -----'----'-- |
193680 |
|
60.2,294·1,408 |
|
Пример 5. Из Госплемкниги крупного рогатого скота горба
'овской породы была извлечена выборка, включающая 100 по IapHo связанных значений двух признаков - годового удоя пер
ютелок и коров по второму и третьему отелам и их масса тела
,табл. 101).
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
Таблица 101 |
|
|
|
|
|
• |
|
|
|
|
Масса |
УдоА, |
Масса |
УдоА, |
Масса |
УдоА. |
Масса |
УдоА, |
|
тела, |
тела, |
тела, |
тела, |
|||||
кг |
кг |
кг |
кг |
|||||
кг |
кг |
кг |
кг |
|||||
|
|
|
|
|||||
327 |
2325 |
440 |
3219 |
287 |
1396 |
360 |
2696 |
|
302 |
1761 |
405 |
1806 |
337 |
1819 |
324 |
2510 |
|
327 |
2310 |
323 |
2803 |
295 |
2523 |
245 |
2615 |
|
294 |
2035 |
411 |
2385 |
339 |
2133 |
345 |
2715 |
|
410 |
2172 |
434 |
2826 |
400 |
1918 |
368 |
2103 |
|
342 |
2277 |
352 |
1832 |
306 |
1302 |
397 |
2023 |
|
409 |
2784 |
295 |
2413 |
335 |
2372 |
405 |
2162 |
|
311 |
1523 |
369 |
2625 |
341 |
2688 |
368 |
2403 |
|
297 |
1838 |
444 |
2614 |
343 |
2131 |
418 |
2483 |
|
364 |
1984 |
319 |
2297 |
411 |
2901 |
371 |
2016 |
|
377 |
1775 |
303 |
1946 |
316 |
2151 |
382 |
2715 |
|
358 |
2700 |
352 |
2278 |
314 |
1734 |
410 |
2878 |
|
284 |
2241 |
344 |
2111 |
396 |
2537 |
443 |
2431 |
|
314 |
1954 |
361 |
3082 |
339 |
1979 |
385 |
3048 |
|
352 |
2046 |
303 |
2478 |
332 |
2142 |
285 |
1791 |
|
387 |
2323 |
328 |
2801 |
328 |
1917 |
321 |
2554 |
|
375 |
1710 |
344 |
2248 |
314 |
1873 |
351 |
2281 |
|
311 |
1868 |
284 |
1085 |
409 |
2630 |
331 |
2292 |
|
332 |
2166 |
295 |
2293 |
367 |
2100 |
355 |
2340 |
|
262 |
1384 |
360 |
2282 |
396 |
2493 |
396 |
2609 |
|
333 |
2288 |
244 |
1736 |
384 |
2632 |
390 |
2499 |
|
381 |
2249 |
279 |
1446 |
356 |
2043 |
426 |
3013 |
|
320 |
1520 |
303 |
2376 |
446 |
2358 |
430 |
2933 |
|
295 |
2389 |
329 |
1937 |
338 |
2309 |
386 |
2682 |
|
345 |
2012 |
323 |
1999 |
300 |
1442 |
331 |
1689 |
Обозначим удой через Х, а массу тела коров - через У и вы 'ислим коэффициент корреляции между этими признаками. В
~овокупности значений прпзнаков находим минимальные и мак
~имальные варианты: xmln=1085 И Хшах=3219; Ymln=244 И
223
Утах=446. В этих границах намечаем классовые интервалы, при нимая К=7:
л |
= 3219 - 1085 |
2134 |
152,4~152 |
и лу= 446-244 ~14. |
|
|
|||
х |
71g100 |
14 |
|
14 |
Затем определяем нижние границы первых классов: ХН= 1085-
-152/2= 1009 и Уи=244-14/2=237. Отсюда ПО,1учаются следу ющие классовые интервалы - по удою (У): 1009 -1161-1313-
1465 - 1617-1769-1921-2073-2225-2377-2529-2681- 2833-2985-3137-3289; по массе коров (Х): 237-251-
265 - |
279 - |
293 - 307 - 321 - 335-349-363-377-391 - |
405 - |
419 - |
433 - 447, В каждом ряду образуется по 15 классов, |
что отвечает рекомендации Юла - Кендэла и гарантирует доста-
Масса |
|
коров Х |
Цент- |
|
|
|
ральные |
|
значення |
|
классо- |
|
вых |
Удо!! У |
ннтерва- |
лоп |
|
|
|
|
|
|
|
|
|
I |
|
237-1 251 |
- |
265 |
- |
279- |
293 |
- |
307_ |
321- |
335- |
|
250 |
264 |
278 |
|
-292 |
-306 |
-320 |
--.134 |
-:И8 |
||
244, |
258 |
|
272 |
|
286 |
300 |
|
314 |
328 |
342 |
I
3137-3288 |
3213 |
|
|
|
|
|
|
|
|
|
2985-3136 |
3061 |
|
|
|
|
|
|
|
|
|
2833-2984 |
2909 |
|
|
|
|
|
|
|
|
|
2681-2832 |
2757 |
|
|
|
|
|
|
2 |
2 |
|
2529-2680 |
2605 |
1 |
|
|
|
|
|
1 |
|
|
2377-2528 |
2453 |
|
|
|
|
4 |
|
1 |
|
|
2225-2376 |
2301 |
|
|
|
1 |
2 |
1 |
4 |
4 |
|
2073-2224 |
2149 |
|
|
|
|
|
1 |
2 |
3 |
|
1921-2072 |
1997 |
|
|
|
|
2 |
1 |
2 |
2 |
|
1769-1920 |
1845 |
|
|
|
1 |
1 |
2 |
1 |
1 |
|
1617-1768 |
1693 |
1 |
|
|
|
1 |
1 |
1 |
|
|
1465-1616 |
1541 |
|
|
|
2 |
|
2 |
|
|
|
1313-1464 |
1389 |
|
1 |
|
1 |
|
|
|
||
1161-1312 |
1237 |
|
|
|
|
1 |
|
|
|
|
1009-1160 |
1085 |
|
|
|
1 |
|
|
|
|
|
'", |
2 |
1 |
О |
5 |
12 |
8 |
14 |
12 |
10 |
|
|
|
|
|
|||||||
а", |
О |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
!",а", |
||||||||||
О |
1 |
О |
15 |
48 |
40 |
84 |
84 |
80 |
||
",а",2 |
О |
1 |
О |
45 |
192 |
200 |
50 |
588 |
640 |
|
|
||||||||||
fll",al/a", |
О |
2 |
О |
51 |
304 |
205 |
648 |
644 |
672 |
|
у., |
2149,0 |
1389,0 |
- |
1601,8 |
2047,7 |
1864,0 |
2257,6 |
2250,3 |
2361,8 |
|
|
224
точную точность коэффициента корреляции, вычисляемого для
этой выборки.
Разграничиваем классы, уменьшая их верхние границы на единицу, строим (по числу классов) корреляционную таблицу и по ее клеткам разносим все 100 вариант данной выборочной со вокупности. В результате получаем распределение общих частот
([ху) двух сопряженных рядов распределения Х и У (табл. 102).
«Крылья» табл. 102 содержат расчет вспомогательных вели
чин, нужных для вычисления коэффициента корреляции спосо
бом условных средних. В качестве последних приняты наимень
шие классовые варианты, т. е. срединные значения классовых
интервалов (Ах= 1085 и Ау=244), для того чтобы все отклоне-
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 102 |
||
349- |
363- |
377- |
391- |
405- |
419- |
433- |
|
|
|
|
|
|
|
|
|
-362 |
-376 |
|
-390 |
-404 |
-418 |
-432 |
-446 |
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
'~ |
|
|
'~a~ |
fуа-/ |
|
||
|
|
|
384 |
398 |
412 |
426 |
440 |
a~ |
|
|
X ll |
||||
356 |
370 |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
1 |
1 |
14 |
|
14 |
196 |
|
440,0 |
|
1 |
|
|
1 |
|
2 |
1 |
|
3 |
13 |
|
39 |
507 |
|
388,7 |
|
|
|
|
|
|
1 |
1 |
3 |
12 |
|
36 |
432 |
|
416,7 |
||
2 |
|
|
2 |
|
1 |
|
10 |
11 |
110 |
1210 |
|
367,2 |
|||
|
|
|
|
1 |
|
||||||||||
|
1 |
|
1 |
2 |
1 |
|
8 |
10 |
|
80 |
800 |
|
341,3 |
||
|
|
|
1 |
|
|
||||||||||
|
1 |
|
1 |
1 |
2 |
|
11 |
|
9 |
|
99 |
891 |
|
358,5 |
|
|
|
|
1 |
|
|
|
|||||||||
4 |
|
|
2 |
|
|
|
19 |
|
8 |
152 |
1216 |
|
342,7 |
||
|
|
|
|
|
|
|
|
||||||||
|
2 |
|
|
|
2 |
|
|
10 |
|
7 |
|
70 |
490 |
|
357,0 |
2 |
2 |
|
|
1 |
|
|
|
12 |
|
6 |
|
72 |
432 |
|
342,0 |
1 |
|
|
1 |
1 |
1 |
|
|
10 |
|
5 |
|
50 |
250 |
|
343,4 |
|
1 |
|
|
|
|
|
|
5 |
|
4 |
|
20 |
80 |
|
311,2 |
|
|
|
|
|
|
|
|
2 |
|
3 |
|
6 |
18 |
|
314,0 |
|
|
|
|
|
|
|
|
4 |
|
2 |
|
8 |
16 |
|
282,5 |
|
|
|
|
|
|
|
|
1 |
|
1 |
|
1 |
1 |
|
300,0 |
|
|
l |
|
|
|
|
|
1 |
|
О |
|
О |
О |
|
286,0 |
7 |
8 |
5 |
9 |
2 |
5 |
100 |
- |
|
|
|
757 |
|
6539 |
||
|
|
|
|
|
|
||||||||||
9 |
10 |
|
11 |
12 |
13 |
14 |
- |
У = А + л |
f |
хах = 1085 + |
|||||
|
55 |
26 |
70 |
|
|
|
|
n |
|
|
|
||||
63 |
80 |
|
108 |
754 |
+ 152 |
757 |
= 2235,64 кг; |
||||||||
567 |
800 |
|
605 |
1296 |
338 |
980 |
6756 |
||||||||
441 |
750 |
|
440 |
984 |
325 |
728 |
6194 |
|
|
100 |
|
|
|
|
|
2149,0 2510,0 |
2301,0 2469,9 2985,0 |
2665,8 |
|
- |
|
|
7Ы |
= 349, |
5 |
6 кг |
|||||
|
|
|
|
|
|
|
|
х = |
244 + 14 -- |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
|
;-1674 |
225 |
ния классов от условиых средних (где эти отклонеиия равны иу
лю) имели положительиый знак.
Значеиия fxyaxa y , как и в предыдущих случаях, рассчитаиы
перемиожеиием отклоиеиий классовых вариаит от условиых сред
иих иа соответствующие частоты fxy. Например, [хуахау=51, что
иаходится внизу табл. 102, получена так:
f"~a,,all:
1·8·3=24
1·5·3=15
2·2·3=12
1'0·3=0
Сумма=51 и Т. Д.
Определяем условиые момеиты первого порядка: Ьх= =757/100=7,57 и Ьу=754j100=7,54, а также средиие квадрати-
ческие отклоиеиия: 8х=V6539/l00-(7,57)2 =2,843 и 8у= = V6756/l00- (7,54)2=3,272. Как и в предыдущих примерах,
8х И 8" вычисляют без виесения поправочного коэффициеита n/ (n-l) и ие умиожают на Лх и Лу, так как эти величины входят
и в числитель и в зиамеиатель формулы, взаимно сокращаясь.
Определив величииы т,fхуахау, Ьх и Ь1l, а также 8х и 811 С учетом
объема выборки n= 100, иаходим значеиие коэффициента корре
ляции между этими призиаками:
6194 |
100· 7 ,57·7,54 |
486,22 |
=0523. |
гху = ------- '--'-- |
|||
100.2,843·3,272 |
930,23 |
' |
Полученная величина 'Х1l указывает на иаличие положительной
средней силы связи между массой тела данной группы коров и
их годовым удоем.
Применим t·критерий для проверки Но-гипотезы в отноше нии величииы 'Х1l=0,523. Ошибка этого показателя Sr=
= Уl -~,523)~ |
Yo,7:l65=0 085. |
Отсю |
Д |
а |
t |
Ф |
= |
0,523 |
=6 14. |
УIОО |
10' |
|
|
|
|
0,085 |
' |
||
В табл. V Приложеиий для |
k=n-2= 100-2=98 и уровня |
значимости сх.=0,1 % иа.ходим tst=3,37. Поскольку tф=6,14>
>3,37, имеются Достаточиые осиоваиия для неприиятия нулевой
гипотезы на высоком уровне значимости (Р<О,ООI).
Оценка разности между коэффициентами корреляции. При
сравнении коэффициентов корреляции двух независимых выбо
рок нулевая гипотеза сводится к предположению о том, что в ге
неральной совокупиости разиица между этими показателями рав
на нулю. Иными словами, следует исходить из предположеиия,
что разиица, наблюдаемая между сравниваемыми эмпирически
ми коэффициентами корреляции, возиикла случаЙио.
Для проверкн этой (нулевой) гипотезы служит t-критерий
Стьюдента, т. е. отношеиие разности между эмпирическими ко·
226
эффициентами корреляции '1 и '2 К своей статистической ошибке,
определяемой по формуле |
|
+ 2 |
|
8d--1/ 2 |
(155) |
||
r |
8" |
8,., |
|
где Sr, И Sr. - ошибки сравниваемых коэффициентов корреляции.
Нулевая гипотеза опровергается при У1СЛОВИИ, что tф =
= Гl - Г2 ~tst для принятого уровня значимости сх. и числа сте
Sd
пеней свободы k= (nl-2) (n2-2) =n! +n2-4.
Прuмер 6. Сравнить коэффициенты ,,=0,762 и '2=0,603, вы
численные на независимых выборках n, = 80 и n2= 86. Разность
между этими показателями d(,,_,.) =0,762 -0,603=0,159. Что
бы оценить достоверность этой разности, нужно рассчитать ее
статистическую ошибку. Предварительно находим квадраты оши
бок для каждого коэффициента корреляции:
|
|
82 = 1-(0,76)2 |
= |
0,4194 |
0,0054; |
|
|
|
|
г, |
80 - 2 |
|
28 |
|
|
|
82 |
= |
1 - (0,603)2 |
_ |
0,6364 |
0,0076. |
|
|
'. |
86 - 2 |
|
84 |
|
|
|
Переходим |
к |
определению |
ошибки разности (dr='I-'2)' |
||||
8d= УО,ОО54 |
+0,0076 =0, 114. |
Критернй |
достоверности tф= |
||||
= о,159/0, 114 = |
1,39. |
Эта величина |
не превосходит |
критической |
|||
точки tst= 1,96 для k=80+86-4= 162 и |
а=5% |
(см. табл. V |
Приложений) , что не позволяет отвергнуть нулевую гипотезу.
Известно, что более точную оценку достоверности коэффици
ента корреляции получают при переводе 'ХII В число Z. ЭТО свя
зано с особенностями распределения 'ХУ, которое не всегда следу
ет нормальному закону (см. рис. 25). Не является исключением
и оценка разности между выборочными коэффициентами корре
ляции " и '2, особенно в тех случаях, когда последние вычислены на выборках сравнительно небольшого объема (n< 100) и по свое
му абсолютному значению значительно превышают 0,50.
Разность z,-Z2=d оценивают с помощью t-критерия Стью
дента, который строят по отношению этой разности к своей ошиб
ке, вычисляемой по формуле
(156)
Нулевую гипотезу отвергают, если Iz =.!!.L > 1st для k=nl +
Sd
+n2-4 и принятого уровня значимости а.
Так, оценку разности между '1=0,762 и '2=0,603 сперевоДом
этих значений в числа ZI и Z2 производят следующим образом.
8* |
~7 |
в табл. ХХII Приложений для '1=0,762 и '2=0,603 находим чис
ла z1=0,996 и z2=0,693, откуда |
t z =-.9.996 - 0,693 = |
||
|
0,303 |
О 303 |
У 1/8О+l/86 |
- |
|
||
УО,О241 |
'=3,95. Эта величина не превосходит крити- |
||
|
0,155 |
|
|
ческую точку t8t = 1,96 для а=5% |
и k= 162. Следовательно, ну |
левая гипотеза остается в силе; разница между сравниваемыми
коэффициентами корреляции оказывается статистически недо
стоверной.
Корреляционное отношение. Как было показано, коэффициент
корреляции служит для измерения только линейной связи. Для
измерения нелинейной зависимости между переменными Х и У
используют предложенный К. Пирсоном показатель, который на
зывают корреляцuонным отношенuем. Если коэффициент корре
ляции характеризует связь между признаками с точки зрения
прямой пропорциональности, то корреляционное отношение, обо
значаемое греческой буквой ТJ (эта), описывает ее двусторонне.
Поясним это на следующем примере. Возьмем ряд сопряженных (парных) значений двух переменных величин Х и У:
Значения Х |
2 |
4 |
6 |
8 |
4 |
4 |
2 |
6 |
Значения у |
4 |
8 |
8 |
7 |
6 |
10 |
6 |
12 |
Ранжируем эти значения по Х:
х
у
2 |
2 |
4 |
4 |
6 |
6 |
6 |
8 |
4 |
6 |
4 |
8 |
10 |
8 |
12 |
7 |
Видно, что некоторые значения Х повторяются, что позволяет
распределить эту выборку следующим образом:
х |
2 |
4 |
6 |
8 |
Ух |
5 |
6 |
10 |
7 |
Здесь Ух - частные или групповые средние из соответствующих
значений переменной У. Например, значению х/=2 соответствует
Ух= (4+6): 2=5; значению х/=6 соответствует ух= (10+8+
+ 12): 3= 10 и т. д.
Если же данную совокупность ранжировать по У, получается
следующий результат: |
|
|
|
|
|
|
|
|
у |
4 |
4 |
6 |
7 |
8 |
8 |
10 |
12 |
Х24286466
Этот ряд состоит ие из четырех, как в первом случае, а из шести
групп, представленных значениями переменной У=4; 6; 7; 8; 10; 12, которым соответствуют следующие частные средние:
l' |
4 |
6 |
7 |
8 |
10 |
12 |
~, |
3 |
2 |
8 |
5 |
6 |
6 |
Конструкция корреляционного отношения предполагает сопо ставление двух видов вариации: изменчивости отдельных наблю-
228