Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

шапкин задачи с решениями

.pdf
Скачиваний:
511
Добавлен:
15.04.2015
Размер:
2.34 Mб
Скачать

Пример 6.34. Пусть генеральная совокупность Х подчинена нормальному закону. Требуется оценить ее параметры.

Так как параметрами нормального распределения являются

σ= σà è a = M (X ) = xà , òî

σ≈ σ при объеме выборки n 30,

σ≈ σ Â при объеме выборки n > 30.

6.4.5. Интервальные оценки параметров распределения. Доверительный интервал для математического ожидания нормального распределения

при известном σ

Пусть СВ Х образуют генеральную совокупность и θ — неизвестный параметр СВ Х. Если статистическая оценка θ * является состоятельной, то чем больше объем выборки, тем точнее пол у- чаем значение θ . Однако на практике мы имеем выборки не очень большого объема, поэтому не можем гарантировать большую точность.

Пусть θ * — статистическая оценка для θ . Величина |θ * – θ | называется точностью оценки. Ясно, что точность является СВ, т.к. θ * — случайная величина. Зададим малое положительное число δ и потребуем, чтобы точность оценки |θ * – θ | была меньше δ , ò.å. | θ * – θ | < δ .

Мы не можем категорически утверждать, что оценка θ * удовлетворяет неравенству | θ * – θ | < δ ; можно лишь говорить о вероятности γ , с которой это неравенство выполнится.

Надежностью γ или доверительной вероятностью оценки θ ïî θ * называется вероятность γ , с которой осуществляется неравенство |θ * – θ | < δ , ò.å.

γ = Ð {|θ * – θ | < δ }.

Обычно надежность g задают наперед, причем, за γ берут число, близкое к 1 (0,9; 0,95; 0,99; …).

Так как неравенство |θ * – θ | < δ равносильно двойному неравенству θ * – δ ≤ θ ≤ θ * + δ , то получаем:

γ = Ð {θ * – δ < θ < θ * + δ }.

331

Интервал (θ * – δ , θ * + δ ) называется доверительным интервалом, т.е. доверительный интервал покрывает неизвестный параметр θ с вероятностью γ . Заметим, что концы доверительного интервала являются случайными и изменяются от выборки к в ы- борке, поэтому точнее говорить, что интервал (θ * – δ , θ * + δ ) покрывает неизвестный параметр θ , à íå θ принадлежит этому интервалу.

Пусть генеральная совокупность задана случайной величи ной Х, распределенной по нормальному закону, причем, среднее кв адратическое отклонение σ известно. Неизвестным является математическое ожидание а = М (Х). Требуется найти доверительный интервал для а при заданной надежности γ .

Выборочная средняя

XÂ = X1 + ... + Xn n

является статистической оценкой для xà = a.

Теорема. Случайная величина x имеет нормальное распре-

деление, если Х имеет нормальное распределение, и M (

 

 ) = a,

X

σ (XÂ ) = σ , ãäå σ =

D (X ), a = M (X ).

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для а имеет вид:

 

 

 

 

 

 

 -δ < a <

 

 + δ

 

 

 

 

 

 

X

X

 

 

 

 

 

è

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P{|

 

 - a | < δ } = γ .

 

 

 

 

 

 

X

 

 

 

 

 

Находим δ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пользуясь соотношением

 

 

 

 

 

 

 

 

 

 

P{| XÂ

æ

δ

ö

æ

δ

n ö

,

 

 

- a | < δ } = 2F ç

σ

 

÷

= 2F ç

σ

÷

 

 

 

ç

 

÷

ç

÷

 

 

 

 

è

 

 

 ø

è

 

ø

 

 

 

ãäå Φ(z) — функция Лапласа, имеем:

 

æ

δ

n ö

 

γ

 

2F

ç

σ

÷

=

.

ç

÷

 

 

è

 

ø

 

 

 

332

Обозначив δ

n

= t,

получим Φ(t) = γ. Òàê êàê γ задана, то по

 

σ

 

 

 

 

 

 

 

 

 

 

 

таблице значений функции Лапласа находим значение t.

Из равенства

t =

δ

 

n находим δ = tσ

— точность оценки.

 

 

 

σ

 

 

 

 

 

 

n

 

Значит, доверительный интервал для а имеет вид:

 

 

æ

 

 

- t ×

σ

,

X

 

+ t ×

σ

ö

 

 

ç X

Â

 

Â

 

÷ .

 

 

ç

 

 

n

 

 

 

n

÷

 

 

è

 

 

 

 

 

 

 

ø

Если задана выборка из генеральной совокупности Х

õi

õ1

õ2

õm

ni

n1

n2

nm

n = n1 + … + nm, то доверительный интервал будет:

æ

m

 

 

 

 

 

σ

m

 

 

 

 

σ

ö

ç

å

ni × xi

 

 

å

ni × xi

 

÷

ç

 

 

 

 

 

 

 

 

÷

ç

i=1

n

 

 

- t ×

 

, i=1

n

+ t ×

 

÷ ,

ç

 

 

 

 

 

n

 

 

 

n ÷

ç

 

 

 

 

 

 

 

 

 

 

 

 

 

÷

è

 

 

 

 

 

 

 

 

 

 

 

 

 

ø

ò.å.

 

æ

 

 

 

σ

 

 

 

σ

ö

 

 

 

 

 

- t ×

< a < x

 

+ t ×

 

 

 

 

ç x

Â

 

 

Â

 

÷ .

 

 

 

 

ç

 

 

 

n

 

 

 

÷

 

 

 

 

è

 

 

 

 

 

 

 

n ø

 

 

Пример 6.35. Найти доверительный интервал для оценки математического ожидания а нормального распределения с надеж-

ностью 0,95, зная выборочную среднюю XÂ = 10,43, объем выборки n = 100 и среднее квадратическое отклонение σ = 5.

Решение. Воспользуемся формулой

x - t × σ < a < x + t × σ .

n

n

Найдем t. Из соотношения 2Φ(t) = 0,95 получим: Φ(t) = 0,475. По таблице находим t = 1,96. Найдем точность оценки

δ = tσ

= 1,96×5 = 0,98.

n

100

333

Искомый доверительный интервал (10,43 – 0,98 < a < 10,43 + 0,98) или (9,45 < a < 11,41).

Смысл полученного результата таков: если будет произведе - но большое число выборок, то 95% из них определят такие доверительные интервалы, в которых математическое ожидание б у- дет заключено.

6.5. Методы расчета характеристик выборки

Рассмотрим рациональные методы определения характеристик выборки x è dB.

6.5.1. Условные варианты. Метод произведений

Пусть выборка из генеральной совокупности Х является вариационным рядом с равноотстоящими вариантами, т.е.

õi

õ1

õ2

õm

ni

n1

n2

nm

õ1 < õ2 < … < õm, õi+1 – õi = h = const, n = n1 + n2 + … + nm. Условными называют варианты ui, определяемые равенством

ui =

xi C

,

h

 

 

где С — ложный нуль. Обычно полагают С равным варианте с наибольшей частотой.

Нетрудно видеть, что условные варианты принимают только целые значения, и, если xi0 = C, òî ui0 = 0.

Условные варианты u1, u2, …, un образуют условную выборку

ui

u1

u2

um

ni

n1

n2

nm

 

 

 

 

 

334

Тогда можно определить условные эмпирические моменты

порядка k:

m

å ni ×uik

 

 

 

 

 

Mk* =

 

i=1

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определив условные выборочные моменты первого и второго

порядка

 

 

 

 

m

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å ni ×ui

 

 

 

 

 

 

å ni ×ui2

 

 

 

M* =

 

i=1

 

;

 

 

M* =

i=1

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

можно определить выборочные среднюю и дисперсию:

 

 

 

x = M* × h +C;

d

Â

 

= [M*

- (M* )2

]× h2 .

 

 

 

Â

 

1

 

 

 

 

2

1

 

 

 

 

 

Пример 6.36. Даны выборочные варианты xi и соответствую-

щие частоты ni количественного признака Х:

 

 

 

 

 

xi

10

 

 

15

 

 

 

 

20

 

 

25

 

30

 

ni

6

 

 

16

 

 

 

 

50

 

 

24

 

4

 

Найти методом произведений выборочные среднюю, дисперсию и среднее квадратическое отклонение.

Решение. Составим расчетную таблицу, для чего:

1)запишем варианты xi в первый столбец;

2)запишем частоты ni во второй столбец;

3)в качестве ложного нуля С выберем варианту 20 (эта варианта имеет наибольшую частоту); в клетке третьего столбца , которая принадлежит строке, содержащей варианту 20, пишем 0; на д нулем последовательно записываем условные варианты –1, –2 , а под нулем — последовательно 1, 2;

4)произведения частот на условные варианты ui записываем в четвертый столбец; находим сумму этих произведений и помещаем ее в нижнюю клетку столбца;

5)произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца (80) помещаем в нижнюю клетку столбца;

335

6) произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный) столбе ц; сумму чисел столбца (188) помещаем в нижнюю клетку столбца.

В итоге получим следующую расчетную таблицу:

x

i

n

i

u

i

 

 

 

n · u

i

 

n

i

× u2

 

 

n

(u + 1)2

 

 

 

 

 

 

 

i

 

 

 

i

 

 

i

i

10

6

–2

 

 

 

 

–12

 

 

 

24

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

16

–1

 

 

 

 

–16

 

 

 

16

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

50

0

 

 

 

 

 

0

 

 

 

 

0

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25

24

1

 

 

 

 

24

 

 

 

24

 

 

 

96

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30

4

2

 

 

 

 

 

8

 

 

 

16

 

 

 

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n = 100

 

 

 

å

 

ni ui

= 4

å

ni

ui2

= 80

å

ni (ui +1)2 =188

 

 

 

 

 

 

 

 

 

 

Контроль

 

 

 

 

å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å

ni × ui2

+2

ni ×ui + n = 80 + 2

×4 +100 =188;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å

ni

(ui +1)2 =188.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Совпадение найденных сумм свидетельствует о том, что вы- числения произведены правильно.

Вычислим условные моменты первого и второго порядков:

M* = å ni ui

=

 

4

= 0,04;

M* = å ni ui2

=

80

= 0,8.

 

 

1

n

 

100

 

2

n

100

 

 

 

 

 

 

Найдем шаг (разность между двумя соседними вариантами): h = 15 – 10 = 5.

Найдем искомую выборочную среднюю:

xâ = M1* × h +C = 0,04×5 + 20 = 20,2.

Найдем искомую выборочную дисперсию:

dâ = [M2* - (M1* )2 ]×h = [0,8 - (0,04)2 ]×52 =19,96.

Найдем искомое среднее квадратическое отклонение:

σ â = dâ = 19,96 = 4,47.

336

6.5.2. Эмпирические и теоретические частоты

Пусть значения СВ Х образуют генеральную совокупность. Закон распределения Х неизвестен.

Рассмотрим некоторую выборку объема n из генеральной совокупности

õi

õ1

õ2

õm

ni

n1

n2

...

nm

 

 

 

 

 

n = n1 + … + nm.

Частоты ni появления вариант xi также называют эмпирическими частотами.

Пусть Х — дискретная СВ и имеются основания предположить, что изучаемая величина Х распределена по некоторому определенному закону. Зная закон распределения Х, мы можем найти вероятности pi появления значений xi, ò.å.

pi = P {X = xi }.

Теоретическими частотами ni называют частоты, определяемые по формуле ni = n · pi.

Нетрудно видеть, что ni указывает, сколько раз должно появиться в среднем значение xi случайной величины Х с предполагаемым законом распределения.

Пусть теперь Х — непрерывная СВ. Рассмотрим более детально определение теоретических частот, предполагая, что Х — нормально распределенная случайная величина.

Пусть

õi

õ1

õ2

õm

ni

n1

n2

...

nm

 

 

 

 

 

n = n1 + … + nm , равноотстоящая выборка из генеральной сово-

купности Х, n1 , … , nm — эмпирические частоты, хi+1 – xi = h. Тогда теоретические частоты определяются по формуле

ni¢ = n × pi ,

ãäå pi — вероятность попадания Х в i-ый частичный интервал с концами xi - 2h è xi + 2h .

337

Приближенно вероятности pi могут быть найдены по формуле

 

 

p

=

h

 

×ϕ (u

),

 

 

 

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

σ Â

 

 

 

 

ãäå ui =

xi - xÂ

, i = 1, 2,

...,

m, ϕ (u) = 1

×e

u2

.

2

 

 

σ Â

 

 

 

 

2π

 

 

 

Значения функции ϕ (u) находятся по таблице.

6.6. Статистическая проверка гипотез

Во многих случаях результаты наблюдений используются дл я проверки предположений (гипотез) относительно либо само го вида распределения генеральной совокупности, либо значе ния параметров уже известного распределения — статистическ их гипотез. Пусть известно распределение СВ Х (например, это нормальный закон), и по выборке необходимо проверить гипотез у о значении некоторого параметра ( xÃ, DÃ èëè σ Ã) этого распределения.

В дальнейшем выдвигаемую и проверяемую гипотезу будем называть нулевой гипотезой (или основной) и обозначать ее че- рез Н0. Наряду с Н0 рассматривают также одну из альтернативных (конкурирующих) гипотез Н1. Например, если проверяется гипотеза о равенстве параметра θ некоторому заданному зна-

чению θ 0, ò.å. Í0: θ = θ 0, то в качестве альтернативной

ãèïî-

тезы можно рассмотреть одну

из следующих: а) Н1: θ

> θ 0;

á) Í1: θ < θ 0; â) Í1: θ ¹ θ 0;

ã) Í1: θ = θ 1, ãäå θ 1 — другое

заданное значение параметра θ .

 

 

Выдвинутая гипотеза Н0 может соответствовать истине или нет. При проверке гипотезы Н0 по результатам выборки могут быть допущены ошибки двух родов: 1) ошибка первого рода — отвергнута правильная гипотеза; 2) ошибка второго рода — пр и- нята неправильная гипотеза. Последствия этих ошибок нера внозначны, и роль каждой оценивается до конца по условиям конк - ретной задачи. Например, если при проверке качества парти и деталей по выборке из нее в качестве Н0 принята гипотеза, что доля брака не более 0,1%, то при допущении здесь ошибки первого рода будет забракована годная продукция, а допустив ошибк у второго рода, выпустим потребителю партию деталей с дол ей

338

брака больше допустимого. Перед началом анализа выборки фиксируют очень малое число α. Вероятность совершить ошибку первого рода называется уровнем значимости α. Обычно берут α = 0,05; 0,01; 0,005.

Правило, по которому принимается решение принять или отклонить гипотезу Н0, называется критерием или статистическим критерием K. Выбор K зависит от конкретной задачи.

Обычно критерий проверки гипотезы реализуется с помощью некоторой статистической характеристики, определенной по выборке, т.е. с помощью некоторой статистики θ . Здесь θ — некоторая СВ, закон распределения которой известен.

В множестве всех возможных значений статистики q критерия K выделим подмножество ω 0, при котором гипотеза Н0 отклоняется. Это подмножество называется критической областью. Т о подмножество значений θ, при котором гипотезу Н0 не отклоняют, называется областью принятия гипотезы (допустимой об ластью). Точки, разделяющие эти области, называются критическ и- ми точками. Для определения критических точек используют принцип практической невозможности событий, имеющих малую вероятность. При этом задаются достаточно малой величино йα, называемой уровнем значимости критерия, и определяют кри ти- ческую область как множество тех значений θ , вероятность которых принадлежать к области ω 0 равнялась бы α, ò.å.

P {θ ω 0 } = α.

Если по данным выборки при данном уровне значимости получается, что θ ω 0, то это может служить основанием для отклонения гипотезы Н0.

Рассмотрим проверку гипотезы о нормальном распределени и генеральной совокупности Х. Пусть распределение Х неизвестно, но есть основание предположить, что Х имеет нормальное распределение, т.е. выдвигается нулевая гипотеза Н0 о нормальности СВ Х. Статистический критерий, с помощью которого проверяется нулевая гипотеза, называется критерием согласия. Име ется несколько критериев согласия. Обычно в них используют ста тистики, имеющие таблицы распределений, подготовленные зара нее: статистику с нормальным нормированным распределением, с татистику χ2 и статистику Фишера. Рассмотрим критерий согласия Пирсона (критерий согласия χ2 Пирсона, χ2 — «xи квадрат»).

339

Пусть для Х получена выборка объема n, заданная в виде статистического ряда с равноотстоящими вариантами:

õi

õ1

õ2

õm

ni

n1

n2

nm

 

 

 

 

 

Найдем по данным выборки величины x è σ B. Предполагая, что Х имеет нормальное распределение, вычислим вели-

÷èíû ni¢ :

 

n

×

h

 

æ x

i -

x

ö

 

 

 

1

 

 

u2

 

 

 

,

ϕ (u)

 

 

e

 

 

 

 

 

 

=

 

 

×

ϕ ç

 

 ÷

=

 

×

2 ,

i

σ

 

 

ç

σ

 

 

÷

 

 

2π

 

 

 

 

 

 

 

 

Â

 

è

 

Â

ø

 

 

 

 

 

 

 

 

называемые теоретическими частотами, в противоположнос ть чему ni здесь называют эмпирическими частотами.

В качестве статистики θ выбирают СВ χ 2:

s

(ni - ni¢ )

2

 

χ 2 = å

 

.

ni¢

 

i=1

 

 

Она подчиняется распределению χ 2 с числом степенной свободы ν = s – r – 1, где s — число различных значений хi; r — число параметров, от которых зависит распределение. Для нормального за-

кона таких параметров два: a = x = M(X ) è σ = s = D ×

n

, ò.å.

 

n -1

 

r = 2, è ν = s – 3. Если эмпирическое и теоретическое распределе-

ния совпадают, то χ 2 = 0. По данному уровню значимости a и числу степеней свободы ν в таблице распределения χ 2 находят кри-

тическое значение χ êðèò2 . и определяют критическую область:

χ 2 < χêðèò2

., ω0 ={χ 2 : χ 2 ³ χêðèò2 .}. Затем вычисляют наблюдаемое

значение χ 2, ò.å. χíàáë2 . по формуле

 

 

 

 

 

 

s

(n

 

- n¢ )2

 

χíàáë.2

 

å

 

 

 

 

 

=

 

i

i .

 

 

 

i=1

 

 

ni¢

Если окажется, что χíàáë2 . < χêðèò2 . то нулевую гипотезу Н0 о том, что X имеет нормальное распределение, принимают. В этом слу- чае опытные данные выборки хорошо согласуются с гипотезо й о нормальном распределении генеральной совокупности.

340