Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
88
Добавлен:
20.04.2015
Размер:
392.78 Кб
Скачать

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Распределения, используемые для проверки гипотез при построении эконометрических моделей.

Нормальное распределение.

Значение исследуемой случайной величины формируется под воздействием очень большого числа независимых случайных факторов, причем сила воздействия каждого отдельного фактора мала и не может превалировать среди остальных, а характер воздействия аддитивный. Если это так, получается нормально распределенная случайная величина.

Функция

 

 

плотности

 

случайной

величины

 

X ,

распределенной

нормально

с

математическим ожиданием µ и дисперсией σ2

 

(кратко распределение N (µ σ2 )), имеет

вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

1

 

 

(xµ)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

(1.29)

 

 

 

 

 

 

 

 

 

 

ϕ(x, µ,σ )=

 

 

 

 

e

2σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2π σ 2

 

 

 

 

 

 

 

 

 

 

функция распределения соответственно имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ(x, µ,σ 2 )=

 

1

 

 

x

 

(t µ)2

 

 

 

 

 

 

 

(1.30)

 

 

 

 

 

 

 

 

 

 

 

 

e

2σ2

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2π σ 2

 

 

 

 

 

 

 

 

Нормальный

 

закон

с

параметрами

µ = 0 , σ2

=1

принято

называть стандартным,

обозначается N (0; 1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В Excel для работы с нормальным распределением используются функции:

 

 

 

НОРМРАСПР(X, среднее, стандартное_откл, интегральная)

 

 

 

 

 

 

 

ϕ(x, µ,σ

2

)=

 

1

 

 

 

(xµ)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

2σ

2

=НОРМРАСПР(x, µ,σ, 0)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2π σ 2

 

 

 

 

 

 

 

 

 

 

Φ(x, µ,σ2 )=

 

1

 

x

 

(t µ)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

2σ2

dt =НОРМРАСПР(x, µ,σ,1)

 

 

 

 

 

 

 

 

2π σ2

 

 

 

 

 

 

 

 

НОРМОБР(вероятность, среднее, стандартное_откл)

 

 

 

 

 

 

 

 

uq =НОРМОБР(q, µ,σ ), где uq квантиль нормального распределения,

определяется по

формуле (1.23).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть X1, X2...Xi ...X N - независимые,

нормально распределенные

случайные величины

с параметрами N (µi σi );

 

α0 ,α1.......αn -действительные числа. Тогда случайная величина

α0 +α1 X1 +....+α Xi .....+αn Xn

также

 

является

нормальной

с

 

математическим

ожиданием: α

0

+α µ +....+α µ

.....+α

n

µ

n

и дисперсией: α σ

2 +.... +α

i

σ 2 .....+α

n

σ 2 .

 

 

 

 

1

1

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

1

1

 

i

 

n

Многомерное нормальное распределение описывает совместное распределение случайного вектора X размера (n×1):

(1.31)

φ(X , M X , ΣX )=

 

1

 

exp

1 (X M X )T ΣX1 (X M X )

n

det (ΣX )

 

 

(2π )2

 

2

 

где M X , ΣX - математическое ожидание и ковариационная матрица случайного вектора X

определятся

по формулам

(1.25), (1.26),

соответственно

det (ΣX )- определитель

ковариационной матрицы. Из формулы (1.31) выводятся свойства нормального распределения.

1) Если cov(xi xj )= 0 для i, j =1....n , то компоненты вектора X независимы. То есть для нормального распределения из диагональности ковариационной матрицы следует

11

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

независимость компонентов случайного вектора. Доказывается это по определению

(формула (1.9)).

2)Частное распределения нескольких компонент вектора X (определяются по формуле (1.10)) тоже будет нормальным.

3)Условное распределение любой из компонент вектора X при фиксированных остальных компонентах, тоже будет нормальным. (определяется по формуле (1.11))

Хиквадрат распределение.

Определим случайную величину χ2 (m) как сумму квадратов m независимых случайных величин, распределенных по стандартному нормальному закону N (0,1). Функция плотности этой величины будет иметь вид

 

 

 

1

 

 

m

1

 

x

 

 

 

 

 

x 2

 

e

2

(1.32)

f

m

m

 

χ2 (m) (x)= 2 2

Γ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

x > 0

x 0

m -принято называть числом степеней свободы. Γ()- это гамма функция

(1.33)

Γ(y)= +∞et t y1dt .

 

0

Функция распределения, как и для нормального распределения, аналитически не выписывается:

 

x

 

 

(1.34)

fχ2 (m) (t )dt x > 0

 

Fχ2 (m) (x)= 0

 

 

 

 

x 0

 

 

0

 

В Excel для работы с хи-квадрат распределением используются функции:

 

ХИ2РАСП(Х, степени_свободы)

 

 

Fχ2 (m) (x)=1ХИ2РАСП(x, m)

 

 

ХИ2ОБР(вероятность, степени_свободы)

 

u1q (χ2 (m))=ωq (χ2 (m))=ХИ2ОБР(q,

m), где u1q (χ2 (m)), ωq (χ2 (m))

-

соответственно, квантиль и процентная точка распределения хи-квадрат с m степенями свободы. Для определения смотри формулы (1.23) и (1.24).

Математическое ожидание и дисперсия χ2 (m)

(1.35)

E (χ2 (m))= m

(1.36)

var (χ2 (m))= 2 m

 

Распределение Стьюдента с m степенями свободы ( t (m)-распределение).

Пусть

X0 , X1, X2...Xi ...Xm независимые случайные величины, распределенные по

стандартному нормальному закону N (0,1). Определим случайную величину t (m):

(1.37) t (m)=

Функция распределения

 

 

X0

=

N

(0,1)

 

1 Xi2

χ

2

(m)

 

 

m

 

 

 

 

 

 

 

 

m

 

m

i=1

 

 

 

t (m) имеет вид:

12

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

 

 

 

 

m +1

 

 

 

 

 

 

 

 

 

 

 

1

 

Γ

 

 

 

 

 

 

x

2

 

m+1

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

ft(m) (x)=

 

 

 

 

 

 

2

 

(1.38)

 

 

1

+

 

 

 

 

 

π m

 

m

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

где Γ()- это гамма функция (смотри формулу (1.33)). Функция распределения t (m)

аналитически не выписывается, определяется численно как интеграл от (1.38).

(1.39)

 

 

 

E (t (m))= 0

 

 

 

(1.40)

 

 

 

D (t (m))=

m

(существует только при m > 2 )

 

m 2

Хвосты

t (m) распределения

толще, чем

у нормального. При m → +∞ функция

плотности

ft(m) (x) стремится к

плотности

стандартного нормального распределения

ϕ(x)=

 

1

e

x2

 

 

 

 

2

.

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

В Excel для работы с t (m) распределением используются функции:

СТЬЮДРАСП(х, степени_свободы, хвосты) СТЬЮДРАСП(x, m,1) = +∞ft(m) (u)du

x

 

 

СТЬЮДРАСП(x, m, 2) = x

ft(m) (u)du + +∞

ft(m) (u)du = 2 +∞ft(m) (u)du

−∞

x

x

СТЬЮДРАСПОБР(вероятность, степени_свободы)

СТЬЮДРАСПОБР(α, m)= x такое, что x

ft(m) (u)du =1α .

x

 

F-распределение.

Рассмотрим две независимые случайные величины χ2 (m1 ) и χ2 (m2 ), закон

распределения которых определяется формулой (1.34). Определим случайную величину

 

 

χ2 (m1 )

(1.41)

F (m1, m2 )=

m1

χ2 (m2 )

 

 

m

 

2

Функция плотности этой случайной величины будет иметь вид

 

 

m + m

 

 

 

 

 

m2

 

 

 

m1

 

 

 

 

m

 

 

 

 

 

 

 

 

m1 2

m2 2

 

 

 

 

 

 

 

 

 

Γ

1

 

 

2

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

x 2

 

 

 

 

(1.42)

fF (m m ) (x)=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

m

 

 

 

 

 

 

m

+m

 

 

1 2

 

 

 

 

 

 

 

(m1 x + m2 )

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

 

 

1

 

 

Γ

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функция распределения F (m1, m2 )

аналитически не

выписывается, определяется

численно как интеграл от (1.42).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Математическое ожидание и дисперсияF (m1, m2 ):

 

 

 

 

 

(1.43)

E (F (m1, m2 ))=

 

m2

 

 

 

(существует только при m2 > 2 )

 

 

 

 

 

 

 

 

 

m

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

(

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

D (F (m1, m2 ))=

 

2 m2

m + m 2

 

 

 

 

 

 

 

 

(1.44)

 

 

 

 

2

 

 

 

1

 

 

 

2

 

 

 

(существует только при m2 > 4 )

 

m1 (m2 2)

2

(m2 4)

 

 

 

 

 

 

 

 

 

 

 

 

 

13

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Так как F (m1

, m2 )=

1

 

, справедлива формула:

F (m2

, m1 )

 

 

 

 

 

(1.46)

ωq (F (m1, m2 ))=

1

 

ω1q (F (m2 , m1 ))

 

В Excel для работы с F (m1, m2 ) распределением используются функции:

FРАСП(х, степени_свободы1; степени_свободы2)

+∞fF (m1 m2 ) (u)du =FРАСП(x, m1, m2 )

x

FРАСПОБР(вероятность, степени_свободы1; степени_свободы2) u1q (F (m1, m2 ))=ωq (F (m1, m2 ))= FРАСПОБР(q, m1, m2 ),где

u1q (F (m1, m2 )), ωq (F (m1, m2 ))-соответственно, квантиль и процентная точка F (m1, m2 ) распределения. Для определения смотри формулы (1.23) и (1.24).

Несколько слов о сходимостях.

Сходимость по вероятности p lim (convergence in probability).

Последовательность случайных величин {XT }

сходится по вероятности к числу c ,

 

 

 

 

 

T =1

 

если для ε > 0 и δ > 0 существует N такое, что для T N выполняется неравенство

(1.47)

P{

 

XT c

 

>δ}< ε

 

 

 

 

Если неравенство (1.47) выполняется, то c называют пределом по вероятности случайной последовательности {XT }T=1 , обозначается p lim XT = c или XT pc .

Свойства придела по вероятности:

1) Пусть XT

последовательность случайных чисел, а g ( )- непрерывная, не зависящая от

T функция, тогда p lim g (XT )= g (p lim XT ).

 

 

 

 

 

2) Пусть XT

и YT - последовательности случайных чисел, причем p lim XT и p lim XT

существуют, тогда p lim (XT YT )= p lim XT p limYT и

 

XT

 

p lim XT

 

p lim

=

.

 

 

 

 

 

YT

p limYT

Сходимость в среднем квадратическом (convergence in mean square).

Последовательность случайных величин {XT }

 

 

сходиться в среднем квадратическом

 

 

 

 

 

 

 

 

T =1

 

 

 

 

 

 

к числу c , (обозначается XT

 

m.s.

 

 

 

 

ε > 0 существует N такое,

что для

 

c ) если для

 

T N выполняется неравенство

 

 

 

 

 

 

 

 

 

 

 

(1.49)

 

 

E (XT c)2 < ε

 

 

 

 

 

 

 

 

Или, проще говоря, Tlim→+∞ (E (XT c)2 )= 0

 

 

 

 

 

 

 

 

 

 

 

Обобщенное

неравенство

 

Чебышева

пусть

 

 

X -случайная величина и

E

 

X

 

r -

 

 

 

 

существует и конечно для некоторых r > 0 , тогда для δ > 0 и c выполняется

 

 

 

 

 

(1.50)

P{

 

X c

 

>δ}

E

 

X c

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δr

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В более привычном нам виде неравенство Чебышева выписывается для r = 2, c = E (X ),

(1.51)

P{

 

X E (X )

 

>δ}

var (X )

 

 

 

 

δ2

 

 

 

Используя (1.50), можно доказать, что из XT m.s.c следует XT pc .

14

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Сходимость в распределении (convergence in distribution).

Последовательность

 

случайных величин

{XT }

сходится

в распределении к

 

 

 

 

 

 

 

 

 

 

T =1

 

 

 

(x)= FX (x), где FX (x)-

случайной величине X (обозначается XT

LX ), если

lim FX

T

 

 

 

 

 

 

 

 

 

 

 

T →+∞

 

 

 

 

 

функция распределения X , FXT (x)- функция распределения XT .

 

 

 

 

Некоторые свойства:

 

 

 

 

 

 

 

 

 

 

 

 

1) Пусть {XT }

и {YT }

последовательности случайных величин, причем YT

LY

 

 

T =1

 

 

 

T =1

 

 

 

 

 

 

 

 

 

 

 

и (XT YT ) P0 , тогда XT

LY

 

 

 

 

 

 

 

 

 

 

2) Пусть {XT }

и {YT }

последовательности случайных величин, причем YT

LY

 

 

T =1

 

 

 

T =1

 

 

 

 

 

 

 

 

 

 

 

и X

T

Pc , тогда

X

T

+Y LY +c и X

T

Y

Lc Y

 

 

 

 

 

 

 

 

 

 

 

T

 

T

 

 

 

 

 

 

 

 

3) Пусть {XT }

последовательность случайных величин, причем {XT }

XT LX ,

 

 

T =1

 

 

 

 

 

 

 

 

 

 

 

 

T =1

 

 

а g ( )- непрерывная,

не

зависящая

от

T функция,

тогда

последовательность

g (XT ) Lg (X ).

 

 

 

4)

 

Пусть

{XT }

последовательность

случайных

величин,

причем

 

 

 

 

 

 

 

 

T =1

 

 

 

 

 

 

 

 

T (XT c) LX ,

g ( )-

непрерывная, не зависящая от

T

 

 

функция,

тогда

последовательность

T (g (XT )g (c)) Lg(c) X , где g(c)=

g (x)

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

x=c

 

 

 

 

Вы должны знать о двух сходимостях в распределении:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) Центральная предельная теорема. Пусть случайные величины Yt -независимы и

одинаково распределены для

t с математическим ожиданием

µ

и дисперсией σ2 .

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yt

T (YT µ) LN (0, σ 2 ).

 

 

 

 

 

 

YT

=

t =1

 

, тогда

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2) t (m) LN (0, 1), где t (m)определяется формулой (1.37)

Статистические оценки и их свойства.

Генеральная совокупность (population)- совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном комплексе условий. (Это чисто математическая абстракция).

Под выборкой (sample) размера N из данной генеральной совокупности могут пониматься две вещи

1)Результаты N наблюдений случайных величин, образующих генеральную совокупность, то есть конкретные числа x1, x2 ,........xN .

2)Последовательность из N случайных величин X1, X 2 ,...Xi .....X N , где Xi -результат,

который мог бы быть получен на i -том шаге N кратного эксперимента.

Если случайные величины X1, X 2 ,...Xi .....X N независимы, то выборка называется

случайной. Наша задача будет состоять в том, чтобы на основе выборки оценивать параметры генеральной совокупности.

Статистика- любая функция от наблюдений, составляющих выборку, и объема выборки N , не зависящая от параметров генеральной совокупности.

Оценка θ) = f (x1... xN )- статистика, использующаяся для оценки неизвестного

параметра генеральной совокупности θ (estimatorформула оценки, estimateзначение оценки после подстановки наблюдений).

15

Свойства оценок.

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

1) Несмещенность E (θ))=θ .(unbiasedнесмещенный)

Свойство несмещенности проверяется по определению.

2) Состоятельность p limθ =θ , где p lim определен в (1.47) (consistentсостоятельный) Есть два способа доказательства состоятельности:

Способ 1. Достаточное условие: если оценка является несмещенной и ее дисперсия стремиться к нулю с ростом выборки, то она является несмещенной. )

Способ 2. По определению предела по вероятности p lim g (n) θ = lim g (n) p limθ . Поэтому если мы можем представить оценку, как произведение состоятельной оценки и функции g (n) и при этом g (n)1, то оценка будет состоятельной.

3) Эффективность var (θ))var (θ)), где θ-любая несмещенная оценка параметра θ . То

есть θ обладает наименьшей дисперсией среди несмещенных оценок (bestэффективный).

Эффективность обычно доказывается по теореме Крамера-Рао, которую мы пока не прошли. Либо по определению, но тогда надо выбрать класс функций, в котором мы ищем эффективную оценку.

Пример 1. Выборка из одинаково распределенных независимых случайных величин с параметрами (µ, σ 2 ). Рассмотрим различные линейные оценки параметра µ . При

анализе их свойств важно понимать, что математическое ожидание суммы равно сумме математических ожиданий, а дисперсия суммы независимых случайных величин равна сумме дисперсий

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) X

=

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E (X

)=

E (Xi )

= n

µ

= µ - оценка несмещенная.

i=1

 

 

 

 

 

 

n

 

 

 

n

 

 

Используем

способ

1

доказательства состоятельности, оценка несмещенная и

 

 

 

 

 

 

 

 

 

 

n

 

 

X

 

 

 

 

σ 2

 

σ 2

 

 

 

D (X )

 

 

 

 

i

 

 

 

 

 

 

= D

 

 

= n

 

 

2

=

 

0 - значит состоятельная, то есть p lim X = µ .

n

 

n

n

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

Докажем, что оценка

 

 

 

 

является эффективной в классе линейных оценок параметра µ .

X

 

 

Пусть µ) = n αi Xi - произвольная линейная оценка параметра µ . Если мы подберем αi -

i=1

таким образом, чтобы оценка µ - была несмещенной и ее дисперсия была минимальной,

то мы

получим

эффективную оценку

в классе линейных оценок.

n

n

n

 

E (µ))= µ αi = µ αi =1 , D (µ))=σ 2 αi2

Задача имеет вид:

i=1

i=1

i=1

 

n αi2 min

i=1n

α =1

i=1 i

16

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Решая ее методом множителей Лагранжа, получаем αi = 1n i , то есть эффективная

оценка и есть X . Решение задачи условной оптимизации единственное, поэтому других линейных эффективных оценок параметра µ не существует.

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

)

X

 

+ X

 

 

 

Xi

 

 

 

 

 

 

 

 

1

2

 

 

i=3

 

 

 

 

 

 

 

 

2) µ =

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

2 (n 2)

 

 

 

 

 

 

1

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E (µ)1 )= 2 µ +

 

µ (n 2)

= µ - оценка несмещенная

 

 

 

 

2 (n 2)

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

Проверим состоятельность способом 1

D (µ)

)=

2 σ 2

+

(n 2)σ2

- к нулю не стремиться

16

4 (n 2)2

 

 

 

 

 

 

 

 

 

 

1

 

 

 

значит доказать состоятельность не удается. По определению доказать состоятельность тоже не получается.

Эффективной оценка не будет, так как в классе линейных несмещенных оценок единственная эффективная оценка - X .

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3) µ)

=

n Xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n 2)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

n2 µ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E (µ2 )=

 

 

µ - оценка смещенная.

 

 

 

 

(n 2)2

 

 

 

 

Попробуем

доказать

 

состоятельность

по

определению

(способ

2):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

n2 X

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p lim µ2

= p lim

 

= lim

 

 

p lim X =1 µ = µ - оценка состоятельна

 

 

(n 2)2

(n 2)2

 

 

 

Эффективной

оценка

не

будет,

так как в

классе

линейных несмещенных

оценок

единственная эффективная оценка - X .

Пример 2. Выборка из нормально распределенных независимых случайных величин с параметрами N (µ, σ 2 ). Рассмотрим различные оценки параметра σ 2 .

n

∑(Xi X )2

1) s2 =

i=1

 

 

(n 1)

 

 

E (s2 )=σ 2 - оценка несмещенная для доказательства смотри Шведова (хотя его там не

понял и проделал сам, что и вам советую сделать)

Проверим состоятельность, используя достаточное условие (способ 1). Оценка несмещенная значит нужно проверить стремиться ли с увеличением выборки дисперсия к нулю. Вспомним, что, так как выборка сделана из нормального распределения

s2

(n 1)

χ2 (n 1),

s2

 

σ 2

 

χ2

(n 1),

 

 

 

σ 2

 

(n 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D (s2 )=

 

σ 4

 

D (χ2

(n

1))=

 

σ 4

 

2 (n

1)=

2 σ 4

0 -стремиться к нулю при

(n 1)

2

(n 1)

2

(n 1)

 

 

 

 

 

 

 

 

 

 

 

больших n , значит оценка состоятельна, то есть p lim s2 =σ2 . Про эффективность оценок дисперсии мы пока ничего не знаем.

17

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

n 2

n ∑(Xi X )

2) d 2 =

i=1

(n +30)2

 

При анализе свойств оценок дисперсии удобно выражать их через оценку с известными

n (n 1)

нам свойствами s2 . Например в нашем случае d 2 = (n +30)2 s2 .

E (d 2 )= n (n 12) σ 2 σ 2 - оценка смещенная.

(n +30)

Состоятельность для оценок дисперсии обычно доказываем по определению (способ 2)

p lim d 2 = p lim

n (n 1)

s2

= lim

n (n 1)

p lim s2

=1 σ 2 =σ 2 - оценка состоятельна.

(n +30)2

(n +30)2

 

 

 

 

 

В тесте задачи будут аналогичные. Для самопроверки решите:

Выборка из одинаково распределенных независимых случайных величин с параметрами (µ, σ2 ). Рассмотрим различные линейные оценки параметра µ , какие из них будут несмещенными, состоятельными, эффективными?

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n

 

 

)

 

 

X

 

+ X

 

+ X

 

 

 

Xi

)

 

 

X

 

+ X

 

+ X

 

)

 

 

Xi

)

 

 

Xi

 

1

 

 

 

 

 

 

 

 

 

 

1

2

3

 

 

 

 

 

i=1

 

µ

 

=

 

1

 

2

 

3

+

 

i=4

, µ

 

=

 

 

 

, µ

 

=

i=2

µ

 

=

 

3

 

 

6

 

 

2

(n 3)

4

 

 

3

 

 

5

(n 1)

6

n

n +5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

µ) = X1 + 4 (i=2 Xi)

7 5 5 n 1

 

 

n

 

 

n

µ)

=

n Xi

µ)

=

n Xi

i=1

i=1

(n + 4)2

(n 20)

8

 

9

 

Выборка из нормально распределенных независимых случайных величин с параметрами

N (µ, σ 2 ).

Рассмотрим

различные

оценки

параметра σ 2 , какие из них будут

несмещенными, состоятельными?

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

 

 

n

 

 

 

d 2 =

ln (n) ∑(Xi X

)2

 

δ2 =

∑(Xi X

)2

1

s2 =

∑(Xi X

)2

 

 

i=1

 

i=1

 

 

i=1

 

 

 

(n +30)2

 

(n 1)

 

n + 4

 

(n 1)

 

 

 

 

 

 

 

Проверка гипотез. Доверительные интервалы.

Нам нужно установить свойства генеральной совокупности. Так как у нас есть только выборка, мы можем это сделать только с определенной вероятностью, используя статистическую процедуру проверки гипотез. Большая часть гипотез, которые мы будем проверять в нашем курсе, будет касаться значений числовых параметров функциональных зависимостей, которые существуют между случайными величинами, образующими генеральную совокупность.

Процедура проверки гипотез.

1)Выдвигается нулевая гипотеза H0 и альтернативная гипотеза H A .

2)Задается уровень значимости α - вероятность отвергнуть H0 , если она на самом деле является справедливой.

3) Строиться критическая статистика γ (x1 x2 xN ), которая при выполнении гипотезы H0 имеет известное нам распределение с функцией распределения Fγ (t ).

4) По имеющимся у нас наблюдениям вычисляется значение γ (x1 x2 xN )=γ) .

18

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

5) В зависимости от вида альтернативной гипотезы H A мы можем сделать следующие утверждения о значении статистики γ (x1 x2 xN ) при ее выполнении. (а) γ (H A )< γ (H0 )

(б) γ (H A )>γ (H0 ) (с) γ (H A )γ (H0 ).

6) Гипотеза H0 не отвергается на уровне значимости α против альтернативной гипотезы

H A , если

(рассмотрим

3

 

случая

 

из

предыдущего пункта) (а) γ) [uα

+∞)

)

u1α ]

)

 

,

u

 

 

,

где

uq -это квантиль распределения

Fγ (t )

(б)γ (−∞

(с) γ

uα

α

 

 

 

 

2

 

1

2

 

 

 

 

 

определяется как Fγ (uq )= P{γ uq }= q .

 

 

 

7) Если утверждения, приведенные в пункте 6, не выполняются, говорят, что гипотеза H0 отвергается на уровне значимости α против альтернативной гипотезы H A .

Несколько понятий связанных с проверкой гипотез:

1) p-value теста (как перевести на русский язык науке не известно, иногда говорят - пизначение)- это такой уровень значимости α , на котором при полученном нами по выборке

значении γ , нулевая гипотеза H0 будет отвергнута против принятой нами H A .

 

2) Мощность теста- вероятность отвергнуть H0 , если она не верна.

 

Если мы сравниваем два теста, в

которых для проверки

одинаковыхH0 и

H A

используются разные γ (x1 x2 xN ) и

Fγ (t ), может оказаться,

что при одинаковом

α

мощность одного теста больше, чем у другого. В этом случае нужно использовать тест с большей мощностью.

3) Критическое множество- множество значений γ , при которых H0 отвергается против принятой нами H A . Критическое множество зависит от уровня значимости α . В пункте 6

приведены множества обратные к критическим.

Доверительный интервал- это случайная область, построенная по выборке, которая с заданной вероятностью накрывает фиксированное, но не известное нам значение параметра генеральной совокупности.

Построение доверительного интервала возможно, если удается подобрать статистику γ (X1 X 2 X N ), которая обладает следующими свойствами:

1) Распределение γ (X1 X 2 X N ) не зависит от параметра θ и описывается одним из

стандартных затабулированных законов распределения.

2) Из того факта, что значения данной статистики заключены в определенных пределах с заданной вероятностью, можно сделать вывод, что неизвестный параметр θ должен

лежать между некоторыми границами с той же самой вероятностью.

 

 

 

 

 

 

Примеры проверки гипотез и построения доверительных интервалов.

 

Проверка гипотезы о среднем значении нормально распределенной случайной

 

 

величины с известной дисперсией.

 

 

 

 

 

 

 

 

 

Выборка размера

N

из

нормально

распределенных

случайных

величины

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

 

известной дисперсией σ2 .

H0

:

µ = µ, γ (x1 x2 xN )

=

X N µ

,

 

 

 

 

 

 

 

 

i=1

 

 

 

 

где X

T

=

 

 

при H

0

 

N

 

 

 

 

 

 

 

 

 

σ

2

 

 

 

 

 

 

 

 

γ (x1 x2 xN ), распределена

N (0, 1). При проверки γ

 

 

 

N

 

 

 

 

 

 

 

 

 

нужно будет сверять с областями

γ) uα (N (0, 1)) +∞), если

H A :µ < µ;

γ) (−∞

u1α (N (0, 1)) ,

если

 

H A :µ > µ

19

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

γ) uα (N (0, 1)),

u

α (N (0, 1)) ,

если H A :µ µ.

Если γ

в

эти

области попадает,

 

 

2

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гипотеза H0

 

не отвергается против соответствующей H A .

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для µ :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T +uα / 2 (N (0, 1)) σ 2

 

 

 

T +u1

α (N (0, 1)) σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

X

N µ X

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T u1α (N (0, 1)) σ 2 N µ X

T +u1

α (N (0, 1)) σ 2 N

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где uα / 2 (N (0, 1))-квантиль стандартного нормального распределения.

 

 

 

 

 

 

 

 

 

 

Проверка гипотезы о среднем значении нормально распределенной случайной

 

 

 

 

 

 

 

 

 

 

 

величины с неизвестной дисперсией.

 

 

 

 

 

 

 

 

 

 

 

 

Выборка

размера N

из

 

нормально

распределенных

случайных величин

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

µ

 

 

 

 

Xi

 

неизвестной

 

дисперсией

H0 :

µ = µ

γ (x1 x2

xN )=

X N

где

 

 

 

 

 

i=1

 

 

X

T =

,

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

1

N

 

(Xi X

N )2 , распределена t (N 1). При проверке γ

 

 

 

 

 

 

 

 

s2 =

i=1

нужно будет сверять с

N 1

областями

 

γ) uα (t (N 1))

+∞),

если

H A :µ < µ; γ) (−∞ u1α (t (N 1)) , если

H A :µ > µ

γ) uα (t (N 1)),

u

α

(t (N 1)) ,

если

H A :µ µ.

Если

γ

в эти области

 

 

 

 

 

 

 

2

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

попадает, гипотеза H0 не отвергается против соответствующей H A .

 

 

 

 

 

 

 

 

 

Доверительный интервал для µ :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T u1α (t (N 1)) s2 N µ X

T +u1α (t (n 1)) s2 N

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка гипотезы о дисперсии нормально распределенной величины.

Выборка размера N из нормально распределенных случайных величины с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

неизвестной дисперсией

H

 

: σ2 =δ2

γ (x x

x

 

)=

 

∑(Xi X

N

)2

 

-при

H

 

распределена

 

N

 

i=1

 

 

 

 

 

 

δ2

 

 

 

 

 

 

 

 

 

0

 

 

 

 

1 2

 

 

 

 

 

 

 

 

0

 

χ2 (N 1). При проверки γ

 

нужно будет сверять с областями γ) 0

u1α (χ2 (N 1)) ,

если

H A :σ2

>δ2 ;

 

 

 

 

γ) uα (χ2 (N 1))

 

+∞),

 

если

 

 

H A :σ2 <δ2

γ) uα (χ2 (N 1)),

 

u

α (χ2

(N 1)) , если H A :σ2

δ2 . Если γ

 

в эти области попадает,

2

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гипотеза

H0 не отвергается против соответствующей H A . Доверительный интервал для

 

 

 

N

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсии σ2 :

 

∑(Xi X

N )2

 

∑(Xi X

N )2

 

 

 

 

 

 

 

i=1

 

 

σ 2

i=1

 

 

 

 

 

 

 

 

u α

(χ2

(N 1))

uα 2 (χ2 (N 1))

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20