Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

отклонению признака У:

11 l1x = Омежrр/ООбщ,

или В других обозначениях

Здесь

ау = УDмежrр = y(~nхWx-Y)I)/n;

х.

0.11 = V Dобщ= V (~n" (у-у,1)/n,

где n-объем выборки (сумма всех частот): nх-частота

значения х признака Х; nl/-частота значения у ПРИЗВ8ка

У; у-общая средняя признака У; ух-условная средняя

призн~~а У.

Аналогично определяется выборочное корреляционное

отношение Х к Уl

Пример. Найти 1lllx по данным корреляционной табл. 18.

у

15

25

nх

-

IIХ

Реш е и и е.

т а б л и Ц а 18

 

 

 

 

10

20

I 30

I

"1/

4

I 28

6

 

з8

 

 

 

 

6

-

6

 

1..2

I

10

28

J2

n=50

 

I 21 I 15 I

20

I

Найдем общую среднюю:

 

 

V= (~fIvI/)/n=(38.15+ 12.25)/50-17,4-

Найдем общее среднее К8адратическое ОТКJIOнение:

011 ==V (~ n,(V-v)I)/n -=

с: У(З8 (15.- J7,4)1+ J2 (25-17.4)11]/50- 4,27.

271

Найдем межгрупповое среднее квадратическое отклоиение:

0- = y[~ n"w,,-y)lj/n=

11"

= У[lO (21-17,4)2+28 (15-17,4)2+ 12 (20-17,4)2)/50 = 2,73.

Искомое корреляционное отношение

'11/" = (J - /011= 2,73/4,27 = 0,64.

11"

§ 12. Свойства выборочного корреляционного

отиошения

Поскольку 11"" обладает теми же свойствами, что

и 11"". перечислим свойства только выборочного корре­

ляционного отношения 11"", которре далее для упрощения

записи будем обозиачать через 11 и для про~'roты речи

называть «ко р реляцион.ным отношением».

С в о й с т в о 1. Корреляционное отношение удовлетво­

ряет двойному неравенству

O~11~l.

Д о к а з а т е л ь с т в о. Неравенство 11 ~ О следует из

того, что 11 есть отношение неотрицательных чисел­

средних квадратических отклонений (межгруппового

кобщему).

Для доказательства неравенства 11 ~ 1 воспользуемся формулой

Dобщ= Dвигр + Dкежгр'

Разделив обе части равенства на Dобщ• получим

1 =-: Dвнгр/DОбщ+ Dмежгр/DОбщ'

или

1 = Dвигр/Dобщ+ 111.

Так как оба слагаемых неотрицательны и сумма их равна

единице, то каждое из них не превышает единиIiы: в част­

ности, 1111 ~ 1. Приняв во внимание, что 11 ~ О, заключаем:

O~11~I.

С в о й с т в о 2. Если 'f) = О, то признак У с призна­ ком Х корреляционной зависимостью не связан.

Д о к а з а т е л ь с т в о. По условию,

'f) = О'меЖГР/О'Общ = О.

Отсюда О'lIежгр = О и, следовательно. Dкежгр= О.

272

Межгрупповая дисперсия есть дисперсия условных (групповых) средних Ух относительно общей средней у. Равенство нулю межгрупповой дисперсии означает, что

при всех значениях Х условные средние сохраняют по­

стоянное значение (равное общей средней). Иными словами, при '1=-0 условная средняя не является функцией от х, а значит, признак У не связан корреляционной зависи­

мостью с признаком х.

3 а м е ч а н и е 1. Можно доказать и обратное предложеине: если

признак У не связан с признаком Х корреляционной заВIIСИМОСТЬЮ,

то т) =0.

с в о й с т в о 3. Если '1 = 1, то признак У связан с при­

знаком Х функциональной зависимостью.

Д о к а з а т е л ь с т в о. По УС.'10ВИЮ,

Отсюда

Возведя обе части равенства в квадрат, получим

Dобщ= I?межгр.

Так как Dо6щ= D Bnrp + Dllежгр, то В силу (*)

Dвнгр = О.

Поскольку внутригрупповая дисперсия есть средняя

арифметическая групповых дисперсий (взвешеиная по объ­ емам групп), то из (**) следует, что дисперсия каждой группы (значений У, соответствующих определенному значению х) равна нулю. А это означает, что в группе

содержатся равные значения У, т. е. каждому значению

Х

cooTBeTc:rByeT

одно значение

У. Следовательно, при

'1 =

1 признак У связан с признаком Х функциональной

зависимостью.

 

 

 

3 а м е q а н и е

2. Можно доказать

и обратное предположение:

если признак У связан с признаком Х функциональной заВИСИМОСТЬJ(),

то '1=1.

 

 

 

Приведем еще два свойства,

опустив доказательства.

 

С в о й с т в о

4. Выборочное корреляционное OтHoureHue

18 -

2730

 

273

не .меньше абсолютной величины выборочного коэффициента

корреляции: '1~ 1rв

с в о й с т в о 5. Если выборочное корреляционное отно­

шение равно абсолютной величине выборочного коэффи­

циента корреляции, то имеет место точная линейная

корреляционная зависимость.

Другими словами, если

'1= Ir в 1,

то точки (Xl~ Уl)'

(X s; У2)' ... , n; У1l) лежат

на прямой

линии регрессии,

найденной способом наименьших квадратов.

§ 13. Корреляционное отношение как мера

корреляционной связи. Достоинства

u

Инедостатки этои меры

Впредыдущем параграфе установлено: при т} = о

признаки не связаны корреляционной зависимостью; при

'1= 1 имеет место функциональная зависимость.

Убедимся, что с возрастанием т} корреляционная связь

становится более тесной. С этой целью преобразуем соот­

ношение Dобщ = D BHrp -+- Dмежгр так:

Dsигр = Dобщ[1- (Dмежгр/DОбщ)]'

или

Dвигр = Dо6щ (1-1)2).

Если 1) -+ 1, то DBltrP --- О, следовательно, стремится к нулю

и каждая из групповых дисперсий. Другими словами, при возрастании 1) значения У, соответствующие опреде­

ленному значению Х, все меньше различаются между

собой и связь У с Х становится более тесной, переходя в функциональную при 1) = 1.

Поскольку в рассуждениях не делалось никаких до­

пущений о форме корреляционной связи, т} служит .мерой

тесноты связи любой, в том числе и линейной, фОРЛШ.

В этом

состоит преимущество корреляционного отношения

перед

коэффициентом корреляции, который оценивает

тесноту

лишь линейной зависимости. Вместе с тем кор­

реляционное отношение обладает н е Д о с т а т к о м: оно

не позволяет судить, насколько близко расположены

точки, найденные по данным наблюдений, к кривой опре­

деленного вида, например к параболе, гиперболе и т. д.

~o объясняется тем, что при определении корреляцион­

ного отношения форма связи во внимание не принималась.

274

§ 14. Простейшие случаи криволинейной

корреляции

Если график регрессии Ух = f (х) или Ху = <р (У)

изображается кривой линией, то корреляцию называют

криволинейной.

Например, функции регрессии У на Х могут иметь

вид:

Ух = axll + Ьх + с (параболическая корреляция второго

порядка);

Ух =ах8 + Ьх2 +сх +d (параболическая корреляция

третьего порядка).

Для определения вида функции регрессии строят точки

(х; Ух) и по их расположению делают заключение о при­ мерном виде функции регрессии; при окончательном ре­ шении принимают во внимание особенности, вытекающие из сущности решаемой задачи.

Теория криволинейной корреляции решает те же за.. дачи, что и теория линейной корреляции (установление

формы и тесноты корреляционной связи). Неизвестные

параметры уравнения регрессии ищут методом наимень­

ших квадратов. Для оценки тесноты криволинейной кор­

реляции служат выборочные корреляционные отношения

(см. § 11).

Чтобы выяСнить суть дела, ограничимся параболиче­

ской корреляцией второго порядка, предположив, что

данные n наблюдений (выборки) позволяют считать, что имеет место именно такая корреляция. В этом случае выборочное уравнение регрессии У на Х имеет вид

 

ух=Ах'+Вх+С,

(*)

где

А, В, С-неизвестные параметры.

 

.

Пользуясь методом наименьших квадратов,

получают

систему линейн~х уравнений относительно неизвестных

параметров (вывод опущен, поскольку он не содержит

ничего нового сравнительно с § 4):

(~n~) А +(~nxX8) В + (~nxX2) С =

~ n.'(ухх

2 ;

(~nxX8) А + (~nxX2) В + (~nxX) С =

~ nхУхХ;

(......)

(~nxx2) А + (~ftwX) в += ~ nхУх'

Найденные из этой системы параметры А, В, С подстав­

ляют в (*); В итоге получают искомое уравнение регрессии.

[8*

275

Пример. Найти выборочное уравнение регрессии У на Х внда

у,,=Ах2 +Вх+С по данным корреЛЯЦИОНIIОЙ табл. 19.

 

 

 

 

 

 

 

Т а 6 л и ц а 19

 

 

 

 

 

х

 

 

 

у

1

 

1, 1

 

1,2

 

 

 

 

 

 

 

n ll

6

8

 

2

 

-

 

10

7

-

 

30

 

-

 

30

7,5

-

I

1

I

9

I

10

nх

8

33

9

n=50

 

 

 

-

6

 

6,73

 

7,5

 

 

Ух

 

 

 

 

Составим расчетную табл. 20.

Подставив числа

(суммы) нижней

строки табл. 20 в (**), получнм систему

 

 

 

 

 

74,98 А+67,48 8+60,89 С=413,93,

}

 

 

67,48 А +60,89 В+55.10 С=373,30,

 

 

 

60,89

А +55,10 В +50

С=337,59.

 

 

Решив

эту систему,

найдем: А = 1,94,

8=2,98, с= 1,10. Напишем

искомое

уравнение регрессии:

 

 

 

 

 

УХ= 1,94x l!+2,98x+ 1,10.

Легко убедиться, что условны~ средние, вычисленные по этому

уравнению, незначительно отличаются от условных средних корре-

ляционной таблицы. Например, при Xl = 1 найдем: ПО таблице Yl = 6;

по уравнению Yl = 1,94+2,98+ 1,10=6,02. Таким образом, найденное

уравнение хорошо согласуется с данными наблюдений (выборки).

§ 15. "онитие о множественной корреляции

До настоящего параграфа рассматривалась кор­

реляционная связь между двумя признаками. Еслн же

нсследуется связь между несколькимн признаками, то

корреляцию называют ,Мн,ожесmеенноU.

276

впростейшем слу­

чае число признаков равно трем и связь меж­

ду ними линейная:

z=ax+by+c.

вэтом случае возни­

кают задачи:

1) найти по данным

наблюдений выборочное

уравнение связи вида

z=Ax+By+C, (*)

т. е. требуется найти

коэффициенты регрес­

сии А и В и параметр С;

2) оценить тесноту

связи между Z и обо­

ими признаками Х. У;

3) оценить тесноту

связи между Z и Х

(при пОСтоянном У),

между Z и У (при по­

стоянном Х).

Первая задача ре­

шается методом наи­

J4eньших квадратов,

причем вместо уравне­

ния (.) удобнее искать

уравнение связи вида

z - z= А (х-х) +

+В (у-у),

где

А

_ 'XZ-'I/Z'XI/. Oz •

-

2

ОХ

 

 

l - fxll

 

>4

 

It

00

I~

t:;!

>4

It

I~ 00

t:;!

,,.It,

It ..00,.

t:;!

>4

It 00 t:;!

'rt

It

о: 00

It

t:;!1t 00

>4

It 00 t:;!

,....It

ц:)

t:;!It 00

It -

~~·

с

:;со)·

~

~c"f·

c"f

c"f

~

со)

~

со)

Q)

со)·

с')

~о)·

с')

~

,

с')

\.CIf'-o·

со) со)

-

-·

f'~-o

Q)

.

-00

.::>

'"f'-o·

ц:)

$00·

......

~

-u')·

о)

C'<I-

00

-о·

u')f'-o·

Q)

~

-

ro

Q)

-

со)

.::>

со)

~

со)

о)

u')f'-o·

со)

со)

00

о)

t!·

00

f'-o·

<D

о)

00О·

\.CI

-~·

I

55

~

277

Здесь r

r 1/Z'

r ХIl-коэффициенты:

корреляции

СООТ­

ветственно

между

признаками Х и

Z, у и Z, Х

и У;

аХ. 01/' оz-средние квадратические отклонения.

Теснота связи признака Z с признаками Х, У оцеНА­

вается выборочнbU1. совокуnн,ы.м коэффициенто.м корреляции

_ VГ~-2ГХIIГХzГI/Z+Г;Z

 

R -

1

2

 

 

 

-Г%fI

 

причем

О ~ R ~ 1.

 

 

 

Теснота связи между Z и Х (при постоянном У),

между

z и У (при

постоянном Х)

оценивается соответ­

ственно частными выборочнbUtи коэффицueнma.ми корре­

ляции:

r xz (11) = V( 2 ) (

2 ) ;

1- ГХIl

1- rlIZ

ГIIZ Х1/ Гхг

r 1/Z (х)

Эги коэффициенты имеют те же свойства и тот же

смысл, что н обыкновенный выборочный коэффициент

v •

корреляции. т. е. служат ДЛЯ оценки линеинои связи

M~Y признаками.

3а.цачв

в задачах 1-2 даны корреляционные табл. 21 и 22. Найти:

а) ГВ: б) выборочные уравнения прямых регрессии; в) 1')I/X И '1Х1/.

Omв." задаче 1. а) 0,636; б) ух=I,17 x+16.78, ХI/=О,З45у+

+1,67; В) Т)1/х=О.656, Т)Х1/=0.651.

278

t.

у

 

5

10

I

15

 

 

10

 

2

-

 

-

20

 

5

4

 

1

30

 

3

I 8

I

6

40

 

-

3

 

б

50

I

-

-

 

2

n х

10

\5

 

15

 

 

-

 

2\

29,33

 

36

Ух

 

 

 

 

 

2.

Таблица 21

л

I

20

fl

у

-

 

Ху

 

 

 

-

2

5

 

-

10

8

 

3

20

112,25

 

б

15

I 16

 

1

3

I 16,67

 

10

In=50

 

 

38

 

 

 

Таблица 22

х

у

I

 

 

 

 

 

n

 

-

 

 

 

 

 

 

 

 

65

95

125

155

]85

2]5

 

у

Ху

 

 

30

5

- -

40

4

I~ -

- I - -

- - -

5 65

16 87,5

50

60

70

-

8

5

4

I -

 

-

17

I

101,18

 

 

 

 

-

1

5

7

2

I

-

15

 

145

-

-

-

-

1

1

2

 

200

 

 

nх

I

9

21

10

[ 11

3

1 n=55

-

34,44

44,76

55

[56,36

63, 33 I

70

Ух

 

 

 

 

 

279

Omв. к задаче 2. а) 0,825; б) ух=О,23х+2I,78. хu=2.92у­

-27,25; В) Т)"х=О,В59. Т)х,,=О,875.

В задачах 3-4 найти выборочные уравнения регрессии Ух=

=Ах2 +Вх+С по данным корреляционных табл. 23 и 24.

3.

у

 

2

25

20

45

-

110

-

nх

20

I

I

Таблица 23

х

3

I

...

I

n"

-

 

-

 

20

30

 

1

 

31

I

 

48

 

49

31

 

49

 

n=IOO

Отв. ух=2,94 х2 +7.27 x-l.25.

Таблица 24

4.

х

у

1

 

2 I

 

 

 

 

2

30

 

1

 

 

1 I

 

i

6

18

I

nх

31

I

19

 

 

Omв. ух=0.39 хl +2.49 х-О,75.

n"

31

19

n=50

280