Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бардасов - Эконометрика.pdf
Скачиваний:
358
Добавлен:
06.03.2016
Размер:
2.47 Mб
Скачать

§ 3. Некоторые статистические определения

Будем полагать, что в нашем распоряжении имеются выборочные данные, которые могут быть использованы для оценки теоретических характеристик, относящихся ко всей генеральной совокупности. Генеральной совокупностью называют совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном реальном комплексе условий. Генеральная совокупность — понятие условно-математическое, и его не следует смешивать с реальными совокупностями, подлежащими статистическому исследованию. Пусть по результатам выборки известны n значений

признака x (x1 ,x2 ,...,xn ) и n значений признака y (y1 ,y2 ,...,yn ).

Выборочное среднее x переменной x (является оценкой математического ожидания M (x)=m ):

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

= 1n xi .

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

Выборочная дисперсия (вариация) переменной х:

 

 

 

 

 

 

 

 

 

n

 

 

n

2

 

 

n

 

xi

2

xi

1

 

 

 

 

 

2

i=1

 

i=1

 

(xix )

Var (x)=

 

=

 

 

 

.

n

n

 

n

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Несмещенная выборочная дисперсия S 2x

переменной х (является

2

несмещенной оценкой теоретической дисперсии σx ):

n

S 2x = n 1 1 (x ix )2 .

i=1

Выборочная ковариация Cov(x, y) является мерой взаимосвязи между двумя переменными х и y:

24

 

1

n

1

n

Cov(x, y)=

(xi

 

)(yi

 

)=

xi yi

 

×

 

=

 

 

×

 

.

x

y

x

y

xy

x

y

n

n

 

 

i=1

 

i=1

Она служит оценкой теоретической ковариации:

σxy =M (xM (x))(yM (y)) .

Иногда при расчете выборочной ковариации делят не на n, а на

(n-1).

Выборочный коэффициент корреляции rxy является более точной по сравнению сковариацией мерой взаимосвязимежду переменными:

 

Cov(x,y)

 

 

 

 

 

×

 

 

 

r xy =

=

 

 

xy

x

y

.

Var (x)×Var (y)

Var (x)×Var (y)

 

 

 

Теоретический коэффициент корреляции ρxy :

 

 

ρxy =

 

σxy

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2xσ2y

 

 

 

 

 

 

 

При строгой положительной линейной связи коэффициенты корреляции равны +1, при строгой отрицательной линейной связи коэффициенты корреляции равны -1. Величина r = 0 означает, что линейная зависимость между переменными в выборке отсутствует. Тот факт, что r = 0 или r = ±1, необязательно означает, что ρ=0

или ρ=±1, и наоборот.

Для определения статистической значимости коэффициента rxy , в случае нормально распределенных случайных величин, ис-

пользуется t-статистика.

Пусть по результатам выборочного наблюдения rxy 0 . Объяс-

няется ли это действительно существующей корреляционной связью между признаками x и y в генеральной совокупности или является следствием случайности отбора элементов в выборку?

По вычисленному значению выборочного коэффициента корреляции r требуется проверить гипотезу:

25

Н0: коэффициент корреляции в генеральной совокупности равен нулю, при альтернативе.

Н1: коэффициент корреляции в генеральной совокупности не равен нулю.

В качестве статистического критерия для гипотезы Н0 обычно используется величина:

t =

 

 

r

 

 

× n2 ,

 

 

1r2

 

 

которая распределена по закону Стьюдента с (n-2) степенями свободы. Гипотеза Н0 отвергается (т. е. корреляционная связь считает-

ся установленной), если t превысит критическое значение tα2 ,n2 с

вероятностью ошибиться α и (n-2) степенями свободы. С доверительной вероятностью (1) истинное значение коэффициента r заключено в пределах:

 

 

 

 

 

 

 

 

 

thz1<ρ<thz2 ,

 

 

 

 

 

 

 

1

ln

1+r

 

 

 

r

u

α

 

, th z =

ez ez

 

 

 

 

 

 

 

 

2

 

 

где

z1,2

=

 

 

 

 

 

 

 

 

 

 

 

z

z — тангенс ги-

2

1r

2

(

)

n3

 

 

 

 

 

 

n1

 

e

+e

 

 

перболический от аргумента z , u

α

— квантиль уровня

α

стандарт-

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ного нормального распределения.

Пример 1.1. Имеются данные о длительности разговоров по мобильным телефонам X (ч) и емкостью батареек Y (мА/ч).

 

 

 

 

 

Таблица 1.1

 

 

 

Расчетная таблица

 

 

 

 

 

 

 

X

Y

X2

Y2

XY

1

2

3

4

5

6

1

4,5

800

20,25

640000

3600

2

4

1500

16

2250000

6000

3

3

1300

9

1690000

3900

4

2

1550

4

2402500

3100

5

2,75

900

7,5625

810000

2475

26

 

 

 

 

 

 

Окончание табл. 1.1

 

1

2

3

4

5

 

6

 

6

1,75

875

3,0625

765625

 

1531,25

 

7

2,25

750

5,0625

562500

 

1687,5

 

8

1,75

1100

3,0625

1210000

 

1925

 

9

1,5

850

2,25

722500

 

1275

 

10

2,35

450

5,5225

202500

 

1057,5

 

Σ

25,85

10075

75,7725

11255625

 

26551,25

 

 

 

 

 

 

 

 

Рассмотрим расчет дисперсии и коэффициента корреляции. Выборочная дисперсия переменной x :

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

2

 

Var (x)=

(xi

 

 

 

)2 =xi2

 

n

xi

n =

x

 

n

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

75,7725

 

 

 

 

 

25,85

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

=0,895.

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная дисперсия переменной y :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

2

 

Var (y)=

(yi

 

)2 =yi

2

n yi

n

y

n

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

i=1

 

 

 

 

 

 

 

11255625

 

 

 

 

 

 

10075 2

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=110506,3.

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Линейный коэффициент корреляции:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

r xy

 

 

 

 

 

 

 

 

 

 

 

nxi yi xi ×yi

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

i=1

 

 

i=1

 

 

 

 

 

 

=

 

 

 

 

 

n

 

 

 

 

 

 

 

n

2

 

n

 

 

n

 

i )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

i2

 

× ny2

y

 

 

 

 

 

 

 

 

 

 

 

 

i=1

x

 

 

(i=1 xi )

 

i=1

i

 

(i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

10×26551,2525,85×10075

 

 

 

 

 

 

 

=0,161.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[10×7577,25 (25,85)2] × [10×11255625 (10075)2]

27

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]