Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Балтийский государственный технический университет "ВОЕНМЕХ" им. Д.Ф. Устинова

Предмет:

Теория вероятностей и математическая статистика

Файл:

Учебное пособие С.Д. Шапорев ПРИКЛАДНАЯ СТАТИСТИКА.pdf

Скачиваний:

504

Добавлен:

26.03.2015

Размер:

2.25 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3311 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

11. Принцип устойчивости и корректности π12 . Оценка θ должна

быть мало критичной к отклонениям условий ее нахождения от номинальных (вида вероятностной модели, наличия помех и тому подобное). Небольшие отклонения условий не должны приводить к большим отклонениям значений оценок, ее точностных показателей. Показателем качества может быть абсолютное или относительное значение меры разброса смещений и дисперсий оценок при переходе от одной модели к другой в заданном классе.

12. Принцип минимума необходимой априорной информации

π13 . Лучшей считается та оценка θ , которая при прочих равных условиях требует меньше априорных данных.

Из других принципов можно отметить принцип простоты реализации π14 , принцип адаптируемости к априорным и исходным данным π15 ,

принцип транзитивности π16 , заключающийся в независимости результа-

тов оценивания от способа разбиения алгоритма на части, принцип самообучения и самоорганизации π17 , принцип универсальности π18 , состоя-

щий в том, что алгоритм оценки θ оказывается пригодным для оценки различных характеристик случайных элементов одного типа или одинаковых характеристик разнотипных случайных элементов.

Все приведенные принципы взаимосвязаны, а иногда и противоречивы, стремление выполнить один принцип противоречит возможности выполнить другой. Кроме того, для выбранного алгоритма f выполнение

некоторых свойств может оказаться принципиально невозможным.

4.3. Точечные оценки вероятности по частоте, математического ожидания и дисперсии

1. Оценка вероятности по частоте. Пусть неизвестный параметр θ есть p - неизвестная вероятность события A , а ее оценка θ - p = nA n - частота этого события по классической схеме случаев. Пусть также nAi - индикатор события A в этой схеме случаев. Распределение nAi , очевидно, таково

nA	0	1
i
pi	1− pA	pA
	i	i
	85

Здесь pAi = pA . Тогда

По определению

∑nA

+ nA

+... + nA

p =

i =1

(nA )= ∑xi pi = 0 q +1 p = p ,

i =1

D(nA

)= ∑xi2 pi

− m2

= 02

q +12 p − p2

= p − p2 = pq .

Отсюда

i =1

1 n

M (p )= M

= M

∑

∑M (nA

)

p ∑1 =

p n = p .

n i =1

i =1

D(p

Аналогично,

= D

∑

∑D(nA )=

n pq =

i=1

Таким образом,

M ( p ) = p , т.е. оценка вероятности по частоте не смещена.

По неравенству Чебышева

D( p

)

Перейдя к

− p

≥

≤

ε2

nε2

противоположному

событию,

получим

т.е.

− p

< ε

>1 −

nε2

− p

< ε

оценка вероятности по частоте –

со-

→1 . Следовательно,

lim D( p ) = lim

стоятельная оценка. К тому же

= 0 ,

таким образом,

n→∞

→∞

это асимптотически эффективная оценка.

Для доказательства эффективности оценки необходимо выяснить, имеет ли она по сравнению с другими оценками, которых может быть достаточно много, наименьшую дисперсию или нет. В некоторых случаях этот минимум хорошо известен; тогда, сравнив с ним дисперсию рассматриваемой оценки, можно ответить на поставленный вопрос.

Так для случайной величины X , распределенной по нормальному закону с дисперсией D(X ), нижняя граница для дисперсий различных не-

смещенных оценок равна pqn . Так как D( p ) совпадает с минимальной

оценкой, то частота p , будучи несмещенной оценкой, является также и эффективной оценкой вероятности p .

2. Оценка математического ожидания. Пусть результаты наблюде-

ний x1, x2 ,..., xn случайной величины X независимы и

M (x1) = M (x2 ) = ... = M (xn ) = M (X ) = mX . Дисперсии

всех

наблюдений

должны быть конечны и

D(xi )= DX , i =

. В этих условиях в качестве

1,n

точечной оценки θ = M (X )

используется среднее арифметическое резуль-

)

1 n

татов наблюдений

θ = mX

∑xi . Найдем математическое ожидание и

n i =1

дисперсию

этой

оценки:

M (mX )= M

∑xi =

∑M (xi ) =

n i =1

= 1 mX n = mX .

Таким образом,

легко доказывается, что

mX - несме-

оценка mX .

Дисперсия

оценки также

практически

очевидна:

щенная

D(mX )=

∑D(xi ) =

DX n =

i =1

Воспользуемся

опять

неравенством

Чебышева,

получим

D(m X )

− m X

≥ ε

≤

или P

mX − mX

ε >1

−

. Оче-

ε2

nε2

видно,

что

средним арифмети-

lim P

mX − mX

< ε =1, т.е. оценка mX

n→∞

ческим - состоятельная оценка.

Эффективность или неэффективность оценки зависит от вида распределения случайной величины X . Если X - нормальная случайная величина, то эта оценка будет эффективной. Для других распределений этого

может и не быть. Асимптотическую эффективность, однако, можно легко
установить: lim			D(mX )= lim	DX	= 0 .

	n	→∞	n→∞	n
3. Оценка дисперсии. Естественной оценкой дисперсии случайной
величины	X	служит ее выборочная дисперсия, т.е. если θ = D(X ), то
)	n		− mX )2 , так как mX = mX . Представим формулу для
θ = DX =	1 ∑(xi
	n i=1

DX в несколько ином виде через центрированные величины:

∑

(xi − mX

− mX + mX )2

∑[(xi − mX )− (mX − mX )]2 =

n i =1

n o

1 n

∑

, но

∑ xi

− m o

− 2m o ∑xi + n m o

n i =1

X i =1

2m o

−

∑ xi

= −

∑(xi − m X )

= −2m o

∑ xi −

∑ m X

i =1

n i =1

= −2m o m X

−

= −2 m o

X 14243

m o

Тогда

∑

− m o

Математическое

ожидание этого

n i =1

1 n

выражения легко находится:

M (DX )=

∑M

− M

m o

n i =1

n −1

∑ D(xi )− D(mX )=

DX n −

DX .

n i =1

Таким образом,

оценка

DX - смещенная оценка. Смещение здесь

равно

−DX

n и при

n → ∞ стремится к нулю. Чтобы получить несме-

щенную оценку достаточно

умножить на

. В результате полу-

n −

чим D~ X =

∑(xi − m X )2

D X - несмещенную оценку дисперсии.

n −1 i =1

−1

Для оценки состоятельности надо найти

D(DX ) .

Это сделать до-

вольно трудно. Можно показать, что D(DX ) = O(1n) и выражается через

центральные моменты вплоть до четвертого порядка. Приведем без доказательства формулы дисперсий смещенной и несмещенной оценок:

D(DX )=

μ4 − μ22

−

2(μ4 − 2μ22 )

μ4 − 3μ22

n(μ4 −μ22 )

2(μ4 − 2μ22 )

μ4 −3μ22

D(DX )=

−

(n −1)2

n(n −1)2

Тогда, опять используя неравенство Чебышева,

D(DX )

DX − DX

≥ ε

≤

= O

lim P

DX − DX

ε2

n→∞

оценка DX - состоятельная оценка, так же как и DX . 88

будем иметь

	=1 , т.е.
< ε	=1 , т.е.

Если

распределение нормально,

то

μ4 = 3μ22

и тогда

2μ2 (n −1)

2D2 (n −1)

2D2

D(DX )=

, а

D(DX )=

. Следовательно, обе

n −1

оценки смещенная и несмещенная асимптотически эффективны.

Имея оценку дисперсии, можно получить еще один интересный ре-

зультат для нормального распределения. Видно, что

D(DX ) < D(DX ) , так

как

2(n −1)

. Таким образом, смещенная оценка диспер-

n −1

сии точнее несмещенной.

4.4.Неравенство Крамера - Рао

Ввычислительных процедурах математической статистики желательно употреблять только те оценки, которые по возможности принимали бы значения, наиболее близкие к неизвестному параметру. Наличие у оценки свойств несмещенности, состоятельности и эффективности дает возможность выбирать такие оценки. Однако практика показывает, что состоятельная оценка может быть смещенной, наоборот, несмещенная оценка не обязана быть состоятельной. Несмещенная оценка может быть неэффективной и тому подобное.

Имеются несколько подходов к нахождению несмещенных оценок с минимальной дисперсией. Такие оценки существуют не всегда, но их нахождение всегда чрезвычайно сложно. Одним из путей построения таких оценок является использование неравенства Крамера – Рао, которое дает нижнюю границу для дисперсии несмещенной оценки.

Пусть θ)n - несмещенная оценка неизвестного параметра θ , построенная по выборке объема n . Тогда

D(θ)n )≥1 nI ,

(4.4.1)

где I = I (θ)- информация Фишера, определяемая в дискретном случае формулой

I = M [(ln p(x,θ))θ/ ]2	n	/			2
	= ∑	pθ(xi ,θ)			p(xi ,θ),	(4.4.2)

	i =1	p(x	i	,θ)

ав непрерывном – формулой

Карл Харальд Крамер (1893-1985) – шведский математик.

I = M [(ln f (x,θ))/	]2	∞	/	(x,θ)
		=	fθ	(x,θ)	f (x,θ)dx .	(4.4.3)
		=	f (x,θ)		f (x,θ)dx .	(4.4.3)
θ		−∞∫	f (x,θ)

Таким образом, дисперсия любой несмещенной оценки не может быть меньше 1nI . Эффективностью несмещенной оценки θ)n называют по Крамеру – Рао величину

e =1 nID(θ)n ).

(4.4.4)

Ясно, что при таком определении эффективность любой оценки θ)n при каждом θ заключена между нулем и единицей, причем чем она ближе к единице при каком-либо θ , тем лучше оценка θ)n при этом значении неизвестного параметра. Если e(θ) =1 при любом θ , то оценка называется эффективной по Крамеру – Рао.

Пример. Рассмотрим оценку θ) = p неизвестной вероятности успеха θ = p в схеме Бернулли. Ранее в подразд. 4.3 доказана несмещенность

этой оценки и получена формула D(p )= pqn . Найдем информацию

Фишера. Так как распределение случайной величины X в каждом опыте в схеме Бернулли совпадает с распределением индикатора, т.е.

x0 = 0

x1 =1

1 − p

то

P(x0 , p) = P(0, p) =1 − p,

P(x1, p)= P(1, p) = p .

Следовательно,

(0, p)

(1, p)

−1

I =

P(0, p)+

(1 −

P(0,

P(1, p)

P(1, p) =

p)+

1 − p

− p

Эффективность будет

равна

e =

=1 ,

т.е.

nID( p )

n (1

pq) ( pq n)

оценка θ) = p

эффективна по Крамеру – Рао.

Надо заметить, что эффективные по Крамеру – Рао оценки существу-

ют крайне редко.

Другой путь к построению эффективных оценок состоит во введении

понятия достаточной статистики.

k-мерная статистика s = (s1,s2,...,sk )Τ = (s1(x1, x2,...,xn ),...,sk (x1, x2,...,xn ))Τ

называется достаточной для параметра θ , если условное распределение Fx1, x2,..., xn (x1, x2 ,..., xn S = s) выборки x1, x2 ,..., xn при условии S = s не зависит от параметра θ .

Это определение на практике для проверки достаточности конкретных статистик использовать весьма сложно, поэтому часто пользуются факторизационной теоремой Неймана – Фишера.


Теорема	4.1	(Неймана –		Фишера). Для того чтобы статистика
s = s(x1, x2 ,..., xn )		была достаточной для параметра			θ , необходимо и
достаточно,	чтобы		ряд	распределения	P(x1, x2 ,..., xn ,θ) =
= P(x1,θ)P(x2 ,θ)...P(xn ,θ)			в дискретном случае или плотность распре-
деления f (x1, x2 ,..., xn ,θ) = f (x1,θ)f (x2 ,θ)... f (xn ,θ) в непрерывном слу-
чае выборки x1, x2 ,..., xn			были представимы в виде
		P(x1, x2 ,..., xn ,θ)= A(x1, x2 ,..., xn )B(s,θ),
		f (x1, x2 ,..., xn ,θ)= A(x1, x2 ,..., xn )B(s,θ),
где функция	A(x1, x2 ,..., xn ) зависит только от x1, x2 ,..., xn , а функция
B(s,θ) только от s и θ .
Пример. Пусть x1, x2 ,..., xn				- выборка из генеральной совокупности с

теоретической функцией распределения, являющейся нормальной со

средним

θ1

и дисперсией

θ2 . Покажем, что

двумерная

статистика

s = (s1, s2 )Τ ,

где

= 1 n (x1 + x2

+ ... + xn ),

s2 = (x1 − s1 )2 +

+ (x

− s )2 +... + (x

− s )2

является

достаточной

для

двумерного пара-

метра θ = (θ ,θ

)Τ . Действительно, формула для n -мерного нормального

f (x , x

, θ) =

+ n(s

− θ

вектора

,..., x

exp −

имеет вид, ука-

2θ2

(2πθ2 )2

занный

теореме

Неймана – Фишера,

котором

A(x , x

)

B(s, θ) =

+ n(s

− θ )2

,..., x

=1,

exp −

2θ2

(2πθ2 )2

Видно, что смысл достаточной статистики s заключается в том, что она включает в себя всю ту информацию о неизвестном параметре θ , которая содержится в исходной выборке x1, x2 ,..., xn . На практике достаточные статистики играют важную роль. Они обладают рядом важных

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 3311 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете Теория вероятностей и математическая статистика