Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Мет.моделирования и прогнозирования эк-ки

.PDF
Скачиваний:
56
Добавлен:
10.05.2015
Размер:
2.61 Mб
Скачать

Вероятностно-статистические модели

111

а точнее случайный интервал I a с вероятностью P

накроет неслу-

чайный параметр a.

 

 

Вероятность P называют доверительной вероятностью, а ин-

тервал Ia доверительным интервалом параметра а.

~

 

~

 

Границы доверительного интервала a1 a и

a2 a на-

зывают доверительными границами.

 

 

~

 

 

 

 

 

 

 

 

f (a)

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

~

~

~

~

a

a

a

a

Рис.4.1. Графическое представление доверительного интервала

 

Получим приближенные доверительные интервалы для наи-

более важных числовых параметров СВ.

 

 

 

Учитывая, что математическое ожидание имеет приблизитель-

но

нормальный

закон

с

параметрами

~~

М[mx ] mx; D[mx ] D[ X ] / n , то с использованием функции

Лапласа можно получить такие доверительные границы, что вероятность нахождения неизвестного параметра между ними (площадь функции плотности в заданных пределах) будет равна P . В итоге для математи-

ческого ожидания mx получим доверительные границы (взяв вместо неизвестной дисперсии ее оценку)

~

~

~

 

~

 

 

a1,2 mx tΦ mx

mx

 

tΦ x / n ,

где tΦ argΦ(P / 2) – обратная функция Лапласа.

Аналогично можно рассуждать и по отношению к дисперсии, хотя слагаемые в формуле для нее зависимы через выборочное среднее. При числе опытов не менее 20 оценка дисперсии приблизительно имеет нормальный закон с характеристиками

112

 

 

 

 

 

 

 

 

 

 

Глава 4

~

 

~

 

1

 

n 3

2

M[Dx

] Dx; D[Dx ]

 

 

4

 

 

 

Dx .

 

n

n(n 1)

 

 

 

 

 

 

 

 

Принимая гипотезу о нормальности оценки дисперсии, получим

для дисперсии Dx доверительные границы

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

1 ~

 

 

n 3 ~2

 

a1,2 Dx t

 

4

 

 

Dx .

n

n(n 1)

Частные случаи доверительных границ для дисперсии.

Если X – нормальная величина, то

 

 

 

~

 

2

 

 

 

 

 

 

 

 

~

 

 

 

~

 

2

 

 

4

3D2; D[D

x

]

 

 

 

D

2

. Тогда a

D

x

t

Φ

D

x

 

.

 

 

 

 

 

 

 

 

х

 

 

n 1

х

 

 

1,2

 

 

 

 

 

 

n 1

 

 

Если X – равномерно распределенная на [a, b] величина, то

 

 

4

 

(b a)4

;

 

Dx

(b a)2

;

 

4 1.8Dx2.

 

 

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

~

 

0.8n 1.2

 

 

 

 

 

 

 

 

 

 

Тогда

a1,2 Dx

tΦDx

 

.

 

 

 

 

 

 

 

 

 

n(n 1)

 

 

 

 

 

 

 

Аналогично можно получить доверительные границы для веро-

ятности альтернативного признака (события А), если из n опытов со-

бытие А наблюдалось m раз:

~

 

~ ~

 

 

~

 

m

 

р 1 р

 

 

a1,2 р

tΦ

 

 

 

;

где р

 

 

.

n

 

 

 

 

 

 

 

 

 

 

n

Для коэффициента

корреляции

 

 

rxy

(принимая гипотезу о

нормальности его оценки с учетом некоторого ее смещения) доверительные границы определяются соотношением

~

~

~2

)

 

~2

 

 

rxy(1 rxy

 

1 rxy

a1,2 rxy

 

 

 

tΦ

 

 

 

.

 

2n

 

 

 

 

 

 

 

n 1

Для повышения точности расчетов доверительных интервалов для коэффициента корреляции rxy (особенно при больших его значени-

ях) целесообразно использовать Z – преобразование Фишера

Z 0.5ln1 ~rxy . 1 ~rxy

Величина Z уже при небольших n с хорошим приближением распределена по нормальному закону с параметрами

Вероятностно-статистические модели

 

 

 

 

 

113

M [Z ] 0.5ln

1 rxy

 

 

rxy

 

;D[Z ]

1

.

 

 

 

 

 

 

 

 

 

 

1 rxy

2(n 1)

 

 

 

 

n 3

Это позволяет получить доверительные границы для величины Z

 

 

 

 

~

 

 

~

 

 

 

t

 

 

1 rxy

 

rxy

 

 

 

Z

0.5ln

 

 

 

 

 

 

 

 

 

 

Ф

 

.

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

1,2

 

 

 

 

 

2(n 1)

n 3

 

 

1 r

 

 

 

 

 

xy

 

 

 

 

 

 

 

 

 

 

 

Отсюда следует, что истинное значение коэффициента корреля-

ции rxy с той же доверительной вероятностью заключено в пределах

 

arg Z1

rxy

 

arg Z2 .

 

 

 

 

 

Нахождение Z по вычисленному значению ~rxy и наоборот про-

изводится с использованием таблиц Z – преобразования.

В выше приведенных формулах оценки параметров случайных величин вычисляются следующим образом:

~

1

n

~

1

n

~ 2

mx

 

xi;

x

 

( xi mx ) ;

 

 

 

n i 1

 

n 1i 1

 

~

 

 

1

n

 

~

 

2

D

 

 

 

( x

m

 

) ;

 

 

 

 

x

 

n 1i 1

i

 

x

 

~

 

1

n

 

~

 

4

 

 

 

 

( x

m

 

) ;

 

 

 

 

4

 

n i 1

i

 

x

 

 

 

n

~

 

 

~

 

 

~

 

( xi mx

)( yi my )

 

 

i 1

 

 

 

 

 

 

rxy

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

~

2

n

~

2

 

 

 

( xi mx )

 

( yi my )

 

 

 

i 1

 

 

i 1

 

 

 

Пример 4.1. Сколько надо произвести наблюдений, чтобы с вероятностью 0,95 получить коэффициент корреляции с точностью 0,3?

Решение. Для оценки точности коэффициента корреляции име-

 

 

 

 

 

 

 

 

 

 

 

~2

 

 

 

 

 

 

 

ем

соотношение

 

 

t

1 rxy

0,3.

 

Так

как

для

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ

 

 

n 1

 

 

 

 

 

 

P

0.95

tΦ argΦ(P

/ 2) 1.96, то требуемое количество наблюде-

ний

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~2

 

t

 

 

2

 

1,96

 

2

 

 

 

 

 

t

1 rxy

 

 

 

 

 

 

 

 

 

 

 

n

 

 

1

 

Φ

 

 

 

 

1

 

 

1 44.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ

 

 

 

 

 

 

 

 

0,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

114

Глава 4

Пример 4.2. С какой вероятностью можно утверждать, что возможность покупки изделия с дефектом находится в пределах от 8 до 12 процентов, если из 30 обследованных изделий, купленных в этом магазине, три оказались с дефектами?

Решение. Имеем для точности альтернативного признака пара-

 

 

~

~

 

 

 

~

 

 

 

 

 

р(1

 

р)

 

 

 

метр tΦ

 

 

 

0,02;

р 0,1;

n 30.

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда tΦ

 

n

 

0,02

 

30

 

0,37.

~

~

 

 

 

 

0,1(1 0,1)

 

р(1 р)

 

 

 

 

 

 

 

Искомая вероятность P 2Φ(0,37) 0,29.

4.5. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ

Гипотезой называют любое предположение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Простой называют гипотезу, содержащую только одно предположение. Сложная гипотеза состоит из нескольких простых гипотез. Статистическая проверка гипотез осуществляется в несколько этапов по следующей схеме.

Этап 1. Выдвигают предположение – нулевую (основную) гипотезу H0 .

Этап 2. Задают величину уровня значимости . Это вероятность того, что будет допущена ошибка первого рода, т.е. будет отвергаться правильная гипотеза.

Этап 3. Для каждой гипотезы H0 должен быть разработан (обоснован математически) статистический критерий (решающее правило), как функция от результатов наблюдений Z( x1,x2,...,xn ).

Функция Z, как и всякая функция от результатов наблюдений, сама является случайной величиной и в предположении о справедливости гипотезы H0 подчинена некоторому хорошо изученному (обычно

заданному в форме таблицы) закону распределения с плотностью f(z). Всю область значений случайной величины Z можно разбить на три час-

ти (рис.4.2.):

1 – область неправдоподобно малых значений критерия (левее точки Zкр.л );

2 – область естественных (или вероятных) значений, т.е. область принятия гипотезы H0 ;

Вероятностно-статистические модели

 

115

3 – область неправдоподобно больших значений (правее точки

Zкр.пр ).

 

 

 

f(z)

 

 

 

1

2

3

 

/2

 

 

/2

 

Zкр. л.

Zкр. пр.

z

Рис.4.2. Двухсторонняя критическая область критерия

Этап 4. Вычисляют критические точки Zкр.л , Zкр.пр в зави-

симости от , числа опытов n, вида функции Z, а также с учетом того, какую основную опасность (гипотеза H1 ) для утверждения H0 представляют отклонения Z (слишком малые; слишком большие; и те, и другие) – совокупность значений критерия, при которых гипотезу H0 отбрасывают.

Суммарная площадь критической области равна . В случае двухсторонней критической области левую и правую части определяют, исходя из условия равенства их площадей величине / 2.

Наиболее часто используются критерии, приводящие либо к нормальному распределению, либо к распределению χ2 , либо к Т

распределению Стьюдента, либо к распределению Фишера. В этих случаях критические точки определяются с использованием таблиц квантилей соответствующих распределений следующим образом (табл.4.2).

Этап 5. В функцию Z подставляют имеющиеся конкретные выборочные данные и подсчитывают численное значение ZH .

Если окажется, что это значение ZH . принадлежит области ве-

роятных значений Z, т.е. области 2, то гипотеза H0 с вероятностью

1 считается не противоречащей данным наблюдения. В противном случае делают вывод, что Z на самом деле не подчиняется закону f(z)

116 Глава 4

(вероятность ошибки этого вывода равна ). Следовательно, гипотеза H0 является несостоятельной, ее отбрасывают и принимают конкури-

рующую гипотезу H1 .

Можно по наблюдаемому значению критерия ZH и по соответ-

ствующим таблицам f(z) определить вероятность того, что значение ZH

обусловлено за счет чисто случайных причин. Если эта вероятность малой не является, то делается вывод о непротиворечивости исходных данных гипотезе H0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.2

Вычисление критических точек для различных распределений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Распределение

 

Левосторонняя

Правосторонняя

Двухсторонняя

 

 

 

 

(используемая

 

критическая

 

 

критическая

 

критическая

 

 

 

 

 

таблица)

 

 

область

 

 

 

область

 

 

 

область

 

 

 

 

 

 

 

 

 

 

Нормальное

 

 

1

 

 

 

1

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

Zкр argΦ

 

 

 

 

 

 

 

 

 

(функция

Z

 

argΦ

 

 

 

Z

 

argΦ

 

 

 

 

 

 

2

 

 

Лапласа)

кр.л

2

 

кр.пр

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 – распре-

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

,

 

 

 

 

деление

 

 

 

 

 

 

 

 

 

 

 

 

кр. л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кр2 2( , )

кр2

.пр 2(1 , )

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

(квантили 2

 

2

 

 

2

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кр.пр

 

 

 

1

 

 

 

 

 

– распределе-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ния)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т-

 

Tкр.л T(1 , )

Tкр.пр T(1 , )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

распределение

 

Tкр T 1

 

 

 

 

 

 

,

 

 

 

 

 

 

2

 

 

 

 

Стьюдента

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

F

 

 

 

;

1

;

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F-

 

 

 

 

 

 

Fкр.пр F(1 ; 1; 2 )

кр.л

 

2

 

 

 

 

 

 

 

 

 

 

Fкр.л F( ; 1; 2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Фишера

 

 

 

 

 

 

 

 

 

 

 

 

F

 

F 1

 

 

 

 

 

; ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

кр.пр

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примеры простейших гипотез

 

 

 

1. Сравнение двух дисперсий нормальных генеральных сово-

купностей.

H0 :Dx Dy.

 

 

 

 

 

 

Критерий

 

 

 

 

 

 

F

~б2

;

~2

~2;

 

 

n 1;

 

n 1,

 

 

 

H

~м2

б

м

 

1

б

2

м

где

nб

– объем выборки с большей дисперсией,

Вероятностно-статистические модели

 

 

 

 

 

 

117

nм – объем выборки с меньшей дисперсией.

~

 

2. Сравнение наблюдаемой относительной частоты

с гипоте-

P

тической вероятностью появления события P0 .

~

 

 

H0 : P0 P.

 

 

~

 

 

 

 

 

 

 

n

 

 

 

 

(P P0 )

 

 

 

Критерий ZH

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P0(1 P0 )

 

 

 

4.6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Задачей корреляционного анализа является измерение тесноты связи между переменными. Для этого могут использоваться много различных показателей. Основные из них следующие.

1. Коэффициент ассоциации (Ka ). Он применяется для оцен-

ки тесноты связи между двумя альтернативными показателями (признаками).

Пусть провели n наблюдений за двумя признаками А и Б и получили таблицу результатов (n n1 n2 n3 n4):

Признак Б

 

Признак А

да

 

нет

 

 

да

n1

 

n2

нет

n3

 

n4

Для оценки степени тесноты связи между такими показателями используют коэффициент ассоциации Ka :

Ka n1n4 n2n3 . n1n4 n2n3

При этом -1 Ka +1.

2. Линейный коэффициент корреляции rxy выражает степень

тесноты линейной связи между двумя количественными переменными X и Y.

r

M[(x mx )( y my )]

 

Rxy

.

 

 

xy

x y

 

x y

 

 

По выборочным данным линейный коэффициент корреляции вычисляется по следующим формулам:

118

Глава 4

~

1

n

~

mx

 

xi ;

rxy

 

 

n i 1

 

n

~

 

 

~

 

( xi mx

)( yi my )

 

i 1

 

 

 

 

.

n

~

 

n

~

2

2

( xi mx )

 

( yi my )

 

i 1

 

 

i 1

 

 

Основные свойства коэффициента корреляции:

rxy = r= r(X,Y) = r(aX + b, cY + d); 1 rxy 1.

Если имеем уравнения регрессии в виде Yx a0 a1x ;

X y b0 b1y , то

rxy a1b1 .

3. Теоретическое корреляционное отношение ( ηyx ) применя-

ется для оценки тесноты нелинейной связи между переменными. Обычно исходные данные могут быть собраны в следующую

таблицу значений системы двух случайных величин (Х,Y):

X \Y

 

y1

y2

...

yj

...

ym

 

x

 

n

n

...

n1j

...

n

 

 

1

 

11

12

 

 

 

1m

 

x

 

n

21

n

22

...

n2 j

...

n

 

 

2

 

 

 

 

 

 

2m

 

...

 

...

...

...

...

...

...

 

 

 

 

 

 

 

 

 

 

xi

 

ni1

ni2

...

nij

...

nim

 

...

 

...

...

...

...

...

...

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

n

k1

n

k2

...

nkj

...

n

km

 

k

 

 

 

 

 

 

 

 

Здесь

ni j - количество вариантов, давших сочетание величин (X

k m

=хi, Y = уj). При этом n nij .

i1j 1

По данной таблице можно вычислить следующие параметры:

 

 

 

1

k m

 

 

 

 

 

 

 

1

 

k m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

my

Y

 

 

 

yjnij

,

mx X

 

 

 

xinij -

средние значения вели-

 

 

 

 

 

 

 

 

n i 1j 1

 

 

 

 

 

 

 

n i 1j 1

 

 

чин X и Y;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1

 

k

m

 

 

2

 

2

 

 

1

 

k

m

 

 

2

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

( yj Y )

 

nij ,

x

 

 

 

( xi X )

 

nij , – дисперсии;

 

 

 

 

 

 

 

 

n i 1j 1

 

 

 

 

 

n i 1j 1

 

 

Вероятностно-статистические модели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

119

 

 

 

 

1

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yxi

 

 

 

yjnij – средние значения Y при фиксированном xi , т.е. сред-

n

 

 

 

 

 

 

i

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ние по строкам (межгрупповые средние);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X yj

 

 

xinij

– средние значения X при фиксированных yj .

n

 

 

 

 

 

 

 

j i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь использованы следующие обозначения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

– такое число раз встречалось значение xi ;

 

 

 

 

 

 

 

ni nij

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

– такое число раз встречалось значение yj .

 

 

 

 

 

 

 

n j nij

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно также вычислить:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

1

 

k

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

межгрупповую дисперсию

 

 

 

 

 

 

 

(Yxi Y )

 

ni ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yx

 

n

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

остаточную дисперсию

OCT2

 

 

1

 

k

 

m

 

 

 

 

 

 

)2nij ;

 

 

 

 

 

 

 

 

( yj Yxi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

общую дисперсию

y

Yx

 

 

OCT .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теоретическое корреляционное отношение вычисляется по фор-

муле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

η

η

yx

 

 

 

σYx

 

 

 

1

σOCT2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т

 

 

 

 

 

σ2y

 

 

 

 

 

σ2y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оно показывает какую часть общей изменчивости составляет

межгрупповая изменчивость.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Свойства ηyx :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) 0 ηxy

1; при этом ηyx

 

=

 

 

1

для функциональной связи,

ηyx 0 для независимых Х и Y;

2)ηyx ryx ; равенство ηyx ryx справедливо, если связь между

Хи Y линейная.

Степень расхождения ηyx и ryx может служить критерием для принятия гипотезы о линейности связи между переменными Х и Y.

120

Глава 4

4. Статистическое корреляционное отношение (эмпириче-

ское, экспериментальное, индекс корреляции) ηэyx .

Формулы расчета ηэyx аналогичны формулам для ηyx за исклю-

чением того, что используются не групповые средние Yxi , а значения функции регрессии (хi), т.е. значения величины Y, вычисленные по не-

которой кривой (функции) связи Y и Х при значении хi. Фактически, ηэyx

оценивает степень близости кривой регрессии к имеющимся данным, т.е. степень удачности выполнения регрессионного анализа.

Для ηэyx и ηyx имеет место неравенство ηэyx ηyx . Оно спра-

ведливо за счет того, что кривая регрессии не всегда проходит через групповые средние.

5. Коэффициент детерминации есть квадрат коэффициента корреляции (для линейной связи) или квадрат корреляционного отноше-

ния (для нелинейной зависимости) СВ Х и Y: Кд = (rху)2; Кд = (ηэyx)2 ; Кд

=yx )2 .

6.Коэффициент множественной корреляции характеризует тесноту линейной связи между одним зависимым и несколькими независимыми показателями.

В случае зависимости результирующей величины от двух пере-

менных Y ( X ,V ) коэффициент множественной корреляции вычисля-

ется по формуле

 

 

 

r

 

 

 

r2 r2 2r

r r

 

 

 

 

 

 

yx

 

yv

yx

yv xv

 

 

 

 

y( x, )

 

 

 

 

 

1 r2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

xv

 

 

 

В общем случае зависимости результирующей величины от не-

скольких остальных переменных

 

X1 ( X2,...,Xm ) коэффициент

множественной корреляции вычисляется по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

*

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r12

r13 ... r1m

0

 

 

 

1

 

r23 ... r2m

 

 

 

 

 

 

 

 

 

 

*

 

1

r23 ... r2m

r21

,

r32

1 ...

r3m

.

 

где

. . . . . . . . .

 

. . . . . . .

 

 

 

 

 

 

 

 

 

 

 

 

 

rm2

rm3 ... 1

rm1

 

 

 

rm2 rm3 ... 1