шапкин задачи с решениями
.pdfПример 6.34. Пусть генеральная совокупность Х подчинена нормальному закону. Требуется оценить ее параметры.
Так как параметрами нормального распределения являются
σ= σà è a = M (X ) = xà , òî
σ≈ σ при объеме выборки n ≤ 30,
σ≈ σ Â при объеме выборки n > 30.
6.4.5. Интервальные оценки параметров распределения. Доверительный интервал для математического ожидания нормального распределения
при известном σ
Пусть СВ Х образуют генеральную совокупность и θ — неизвестный параметр СВ Х. Если статистическая оценка θ * является состоятельной, то чем больше объем выборки, тем точнее пол у- чаем значение θ . Однако на практике мы имеем выборки не очень большого объема, поэтому не можем гарантировать большую точность.
Пусть θ * — статистическая оценка для θ . Величина |θ * – θ | называется точностью оценки. Ясно, что точность является СВ, т.к. θ * — случайная величина. Зададим малое положительное число δ и потребуем, чтобы точность оценки |θ * – θ | была меньше δ , ò.å. | θ * – θ | < δ .
Мы не можем категорически утверждать, что оценка θ * удовлетворяет неравенству | θ * – θ | < δ ; можно лишь говорить о вероятности γ , с которой это неравенство выполнится.
Надежностью γ или доверительной вероятностью оценки θ ïî θ * называется вероятность γ , с которой осуществляется неравенство |θ * – θ | < δ , ò.å.
γ = Ð {|θ * – θ | < δ }.
Обычно надежность g задают наперед, причем, за γ берут число, близкое к 1 (0,9; 0,95; 0,99; …).
Так как неравенство |θ * – θ | < δ равносильно двойному неравенству θ * – δ ≤ θ ≤ θ * + δ , то получаем:
γ = Ð {θ * – δ < θ < θ * + δ }.
331
Интервал (θ * – δ , θ * + δ ) называется доверительным интервалом, т.е. доверительный интервал покрывает неизвестный параметр θ с вероятностью γ . Заметим, что концы доверительного интервала являются случайными и изменяются от выборки к в ы- борке, поэтому точнее говорить, что интервал (θ * – δ , θ * + δ ) покрывает неизвестный параметр θ , à íå θ принадлежит этому интервалу.
Пусть генеральная совокупность задана случайной величи ной Х, распределенной по нормальному закону, причем, среднее кв адратическое отклонение σ известно. Неизвестным является математическое ожидание а = М (Х). Требуется найти доверительный интервал для а при заданной надежности γ .
Выборочная средняя
XÂ = X1 + ... + Xn n
является статистической оценкой для xà = a.
Теорема. Случайная величина x имеет нормальное распре-
деление, если Х имеет нормальное распределение, и M ( |
|
 ) = a, |
|||||||||||||
X |
|||||||||||||||
σ (XÂ ) = σ , ãäå σ = |
D (X ), a = M (X ). |
|
|
|
|
|
|||||||||
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доверительный интервал для а имеет вид: |
|
|
|
||||||||||||
|
|
|
 -δ < a < |
|
 + δ |
|
|
|
|
|
|||||
|
X |
X |
|
|
|
|
|
||||||||
è |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P{| |
|
 - a | < δ } = γ . |
|
|
|
|
|
|||||||
|
X |
|
|
|
|
|
|||||||||
Находим δ . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пользуясь соотношением |
|
|
|
|
|
|
|
|
|
|
|||||
P{| XÂ |
æ |
δ |
ö |
æ |
δ |
n ö |
, |
|
|
||||||
- a | < δ } = 2F ç |
σ |
|
÷ |
= 2F ç |
σ |
÷ |
|
|
|||||||
|
ç |
|
÷ |
ç |
÷ |
|
|
|
|||||||
|
è |
|
|
 ø |
è |
|
ø |
|
|
|
ãäå Φ(z) — функция Лапласа, имеем:
|
æ |
δ |
n ö |
|
γ |
|
2F |
ç |
σ |
÷ |
= |
. |
|
ç |
÷ |
|
||||
|
è |
|
ø |
|
|
|
332
Обозначив δ |
n |
= t, |
получим Φ(t) = γ. Òàê êàê γ задана, то по |
|||||||||
|
σ |
|
|
|
|
|
|
|
|
|
|
|
таблице значений функции Лапласа находим значение t. |
||||||||||||
Из равенства |
t = |
δ |
|
n находим δ = tσ |
— точность оценки. |
|||||||
|
|
|
σ |
|
|
|
|
|
|
n |
|
|
Значит, доверительный интервал для а имеет вид: |
||||||||||||
|
|
æ |
|
|
- t × |
σ |
, |
X |
|
+ t × |
σ |
ö |
|
|
ç X |
 |
|
 |
|
÷ . |
|||||
|
|
ç |
|
|
n |
|
|
|
n |
÷ |
||
|
|
è |
|
|
|
|
|
|
|
ø |
Если задана выборка из генеральной совокупности Х
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
… |
nm |
n = n1 + … + nm, то доверительный интервал будет:
æ |
m |
|
|
|
|
|
σ |
m |
|
|
|
|
σ |
ö |
ç |
å |
ni × xi |
|
|
å |
ni × xi |
|
÷ |
||||||
ç |
|
|
|
|
|
|
|
|
÷ |
|||||
ç |
i=1 |
n |
|
|
- t × |
|
, i=1 |
n |
+ t × |
|
÷ , |
|||
ç |
|
|
|
|
|
n |
|
|
|
n ÷ |
||||
ç |
|
|
|
|
|
|
|
|
|
|
|
|
|
÷ |
è |
|
|
|
|
|
|
|
|
|
|
|
|
|
ø |
ò.å. |
|
æ |
|
|
|
σ |
|
|
|
σ |
ö |
|
|
|
|
|
|
- t × |
< a < x |
|
+ t × |
|
|
||||||
|
|
ç x |
 |
|
|
 |
|
÷ . |
|
|
||||
|
|
ç |
|
|
|
n |
|
|
|
÷ |
|
|
||
|
|
è |
|
|
|
|
|
|
|
n ø |
|
|
Пример 6.35. Найти доверительный интервал для оценки математического ожидания а нормального распределения с надеж-
ностью 0,95, зная выборочную среднюю XÂ = 10,43, объем выборки n = 100 и среднее квадратическое отклонение σ = 5.
Решение. Воспользуемся формулой
x - t × σ < a < x + t × σ . |
|
n |
n |
Найдем t. Из соотношения 2Φ(t) = 0,95 получим: Φ(t) = 0,475. По таблице находим t = 1,96. Найдем точность оценки
δ = tσ |
= 1,96×5 = 0,98. |
n |
100 |
333
Искомый доверительный интервал (10,43 – 0,98 < a < 10,43 + 0,98) или (9,45 < a < 11,41).
Смысл полученного результата таков: если будет произведе - но большое число выборок, то 95% из них определят такие доверительные интервалы, в которых математическое ожидание б у- дет заключено.
6.5. Методы расчета характеристик выборки
Рассмотрим рациональные методы определения характеристик выборки x è dB.
6.5.1. Условные варианты. Метод произведений
Пусть выборка из генеральной совокупности Х является вариационным рядом с равноотстоящими вариантами, т.е.
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
… |
nm |
õ1 < õ2 < … < õm, õi+1 – õi = h = const, n = n1 + n2 + … + nm. Условными называют варианты ui, определяемые равенством
ui = |
xi − C |
, |
|
h |
|||
|
|
где С — ложный нуль. Обычно полагают С равным варианте с наибольшей частотой.
Нетрудно видеть, что условные варианты принимают только целые значения, и, если xi0 = C, òî ui0 = 0.
Условные варианты u1, u2, …, un образуют условную выборку
ui |
u1 |
u2 |
… |
um |
ni |
n1 |
n2 |
… |
nm |
|
|
|
|
|
334
Тогда можно определить условные эмпирические моменты
порядка k:
m
å ni ×uik
|
|
|
|
|
Mk* = |
|
i=1 |
|
|
. |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Определив условные выборочные моменты первого и второго |
||||||||||||||||||
порядка |
|
|
|
|
m |
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
å ni ×ui |
|
|
|
|
|
|
å ni ×ui2 |
|
|
||||
|
M* = |
|
i=1 |
|
; |
|
|
M* = |
i=1 |
|
, |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
1 |
|
|
n |
|
|
|
|
2 |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
можно определить выборочные среднюю и дисперсию: |
|
|
||||||||||||||||
|
x = M* × h +C; |
d |
 |
|
= [M* |
- (M* )2 |
]× h2 . |
|
|
|||||||||
|
 |
|
1 |
|
|
|
|
2 |
1 |
|
|
|
|
|
||||
Пример 6.36. Даны выборочные варианты xi и соответствую- |
||||||||||||||||||
щие частоты ni количественного признака Х: |
|
|
|
|
|
|||||||||||||
xi |
10 |
|
|
15 |
|
|
|
|
20 |
|
|
25 |
|
30 |
|
|||
ni |
6 |
|
|
16 |
|
|
|
|
50 |
|
|
24 |
|
4 |
|
Найти методом произведений выборочные среднюю, дисперсию и среднее квадратическое отклонение.
Решение. Составим расчетную таблицу, для чего:
1)запишем варианты xi в первый столбец;
2)запишем частоты ni во второй столбец;
3)в качестве ложного нуля С выберем варианту 20 (эта варианта имеет наибольшую частоту); в клетке третьего столбца , которая принадлежит строке, содержащей варианту 20, пишем 0; на д нулем последовательно записываем условные варианты –1, –2 , а под нулем — последовательно 1, 2;
4)произведения частот на условные варианты ui записываем в четвертый столбец; находим сумму этих произведений и помещаем ее в нижнюю клетку столбца;
5)произведения частот на квадраты условных вариант запишем в пятый столбец; сумму чисел столбца (80) помещаем в нижнюю клетку столбца;
335
6) произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой (контрольный) столбе ц; сумму чисел столбца (188) помещаем в нижнюю клетку столбца.
В итоге получим следующую расчетную таблицу:
x |
i |
n |
i |
u |
i |
|
|
|
n · u |
i |
|
n |
i |
× u2 |
|
|
n |
(u + 1)2 |
||
|
|
|
|
|
|
|
i |
|
|
|
i |
|
|
i |
i |
|||||
10 |
6 |
–2 |
|
|
|
|
–12 |
|
|
|
24 |
|
|
|
6 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
15 |
16 |
–1 |
|
|
|
|
–16 |
|
|
|
16 |
|
|
|
0 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
20 |
50 |
0 |
|
|
|
|
|
0 |
|
|
|
|
0 |
|
|
|
50 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
25 |
24 |
1 |
|
|
|
|
24 |
|
|
|
24 |
|
|
|
96 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
30 |
4 |
2 |
|
|
|
|
|
8 |
|
|
|
16 |
|
|
|
36 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n = 100 |
|
|
|
å |
|
ni ui |
= 4 |
å |
ni |
ui2 |
= 80 |
å |
ni (ui +1)2 =188 |
|||||
|
|
|
|
|
|
|
|
|
|
|||||||||||
Контроль |
|
|
|
|
å |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
å |
ni × ui2 |
+2 |
ni ×ui + n = 80 + 2 |
×4 +100 =188; |
|||||||||||||
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
å |
ni |
(ui +1)2 =188. |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Совпадение найденных сумм свидетельствует о том, что вы- числения произведены правильно.
Вычислим условные моменты первого и второго порядков:
M* = å ni ui |
= |
|
4 |
= 0,04; |
M* = å ni ui2 |
= |
80 |
= 0,8. |
||
|
|
|||||||||
1 |
n |
|
100 |
|
2 |
n |
100 |
|
||
|
|
|
|
|
Найдем шаг (разность между двумя соседними вариантами): h = 15 – 10 = 5.
Найдем искомую выборочную среднюю:
xâ = M1* × h +C = 0,04×5 + 20 = 20,2.
Найдем искомую выборочную дисперсию:
dâ = [M2* - (M1* )2 ]×h = [0,8 - (0,04)2 ]×52 =19,96.
Найдем искомое среднее квадратическое отклонение:
σ â = dâ = 19,96 = 4,47.
336
6.5.2. Эмпирические и теоретические частоты
Пусть значения СВ Х образуют генеральную совокупность. Закон распределения Х неизвестен.
Рассмотрим некоторую выборку объема n из генеральной совокупности
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
... |
nm |
|
|
|
|
|
n = n1 + … + nm.
Частоты ni появления вариант xi также называют эмпирическими частотами.
Пусть Х — дискретная СВ и имеются основания предположить, что изучаемая величина Х распределена по некоторому определенному закону. Зная закон распределения Х, мы можем найти вероятности pi появления значений xi, ò.å.
pi = P {X = xi }.
Теоретическими частотами ni называют частоты, определяемые по формуле ni = n · pi.
Нетрудно видеть, что ni указывает, сколько раз должно появиться в среднем значение xi случайной величины Х с предполагаемым законом распределения.
Пусть теперь Х — непрерывная СВ. Рассмотрим более детально определение теоретических частот, предполагая, что Х — нормально распределенная случайная величина.
Пусть
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
... |
nm |
|
|
|
|
|
n = n1 + … + nm , равноотстоящая выборка из генеральной сово-
купности Х, n1 , … , nm — эмпирические частоты, хi+1 – xi = h. Тогда теоретические частоты определяются по формуле
ni¢ = n × pi ,
ãäå pi — вероятность попадания Х в i-ый частичный интервал с концами xi - 2h è xi + 2h .
337
Приближенно вероятности pi могут быть найдены по формуле
|
|
p |
= |
h |
|
×ϕ (u |
), |
|
|
|
|
|
|
|
|
|
|||||||
|
|
i |
|
|
|
i |
|
|
|
|
|
|
|
|
σ Â |
|
|
|
|
||||
ãäå ui = |
xi - x |
, i = 1, 2, |
..., |
m, ϕ (u) = 1 |
×e− |
u2 |
. |
||||
2 |
|||||||||||
|
|||||||||||
|
σ Â |
|
|
|
|
2π |
|
|
|
Значения функции ϕ (u) находятся по таблице.
6.6. Статистическая проверка гипотез
Во многих случаях результаты наблюдений используются дл я проверки предположений (гипотез) относительно либо само го вида распределения генеральной совокупности, либо значе ния параметров уже известного распределения — статистическ их гипотез. Пусть известно распределение СВ Х (например, это нормальный закон), и по выборке необходимо проверить гипотез у о значении некоторого параметра ( xÃ, DÃ èëè σ Ã) этого распределения.
В дальнейшем выдвигаемую и проверяемую гипотезу будем называть нулевой гипотезой (или основной) и обозначать ее че- рез Н0. Наряду с Н0 рассматривают также одну из альтернативных (конкурирующих) гипотез Н1. Например, если проверяется гипотеза о равенстве параметра θ некоторому заданному зна-
чению θ 0, ò.å. Í0: θ = θ 0, то в качестве альтернативной |
ãèïî- |
|
тезы можно рассмотреть одну |
из следующих: а) Н1: θ |
> θ 0; |
á) Í1: θ < θ 0; â) Í1: θ ¹ θ 0; |
ã) Í1: θ = θ 1, ãäå θ 1 — другое |
|
заданное значение параметра θ . |
|
|
Выдвинутая гипотеза Н0 может соответствовать истине или нет. При проверке гипотезы Н0 по результатам выборки могут быть допущены ошибки двух родов: 1) ошибка первого рода — отвергнута правильная гипотеза; 2) ошибка второго рода — пр и- нята неправильная гипотеза. Последствия этих ошибок нера внозначны, и роль каждой оценивается до конца по условиям конк - ретной задачи. Например, если при проверке качества парти и деталей по выборке из нее в качестве Н0 принята гипотеза, что доля брака не более 0,1%, то при допущении здесь ошибки первого рода будет забракована годная продукция, а допустив ошибк у второго рода, выпустим потребителю партию деталей с дол ей
338
брака больше допустимого. Перед началом анализа выборки фиксируют очень малое число α. Вероятность совершить ошибку первого рода называется уровнем значимости α. Обычно берут α = 0,05; 0,01; 0,005.
Правило, по которому принимается решение принять или отклонить гипотезу Н0, называется критерием или статистическим критерием K. Выбор K зависит от конкретной задачи.
Обычно критерий проверки гипотезы реализуется с помощью некоторой статистической характеристики, определенной по выборке, т.е. с помощью некоторой статистики θ . Здесь θ — некоторая СВ, закон распределения которой известен.
В множестве всех возможных значений статистики q критерия K выделим подмножество ω 0, при котором гипотеза Н0 отклоняется. Это подмножество называется критической областью. Т о подмножество значений θ, при котором гипотезу Н0 не отклоняют, называется областью принятия гипотезы (допустимой об ластью). Точки, разделяющие эти области, называются критическ и- ми точками. Для определения критических точек используют принцип практической невозможности событий, имеющих малую вероятность. При этом задаются достаточно малой величино йα, называемой уровнем значимости критерия, и определяют кри ти- ческую область как множество тех значений θ , вероятность которых принадлежать к области ω 0 равнялась бы α, ò.å.
P {θ ω 0 } = α.
Если по данным выборки при данном уровне значимости получается, что θ ω 0, то это может служить основанием для отклонения гипотезы Н0.
Рассмотрим проверку гипотезы о нормальном распределени и генеральной совокупности Х. Пусть распределение Х неизвестно, но есть основание предположить, что Х имеет нормальное распределение, т.е. выдвигается нулевая гипотеза Н0 о нормальности СВ Х. Статистический критерий, с помощью которого проверяется нулевая гипотеза, называется критерием согласия. Име ется несколько критериев согласия. Обычно в них используют ста тистики, имеющие таблицы распределений, подготовленные зара нее: статистику с нормальным нормированным распределением, с татистику χ2 и статистику Фишера. Рассмотрим критерий согласия Пирсона (критерий согласия χ2 Пирсона, χ2 — «xи квадрат»).
339
Пусть для Х получена выборка объема n, заданная в виде статистического ряда с равноотстоящими вариантами:
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
… |
nm |
|
|
|
|
|
Найдем по данным выборки величины x è σ B. Предполагая, что Х имеет нормальное распределение, вычислим вели-
÷èíû ni¢ : |
|
n |
× |
h |
|
æ x |
i - |
x |
ö |
|
|
|
1 |
|
|
− |
u2 |
|
||
n¢ |
|
|
, |
ϕ (u) |
|
|
e |
|
||||||||||||
|
|
|
|
|
||||||||||||||||
= |
|
|
× |
ϕ ç |
|
 ÷ |
= |
|
× |
2 , |
||||||||||
i |
σ |
|
|
ç |
σ |
|
|
÷ |
|
|
2π |
|
|
|
|
|||||
|
|
|
|
 |
|
è |
|
 |
ø |
|
|
|
|
|
|
|
|
называемые теоретическими частотами, в противоположнос ть чему ni здесь называют эмпирическими частотами.
В качестве статистики θ выбирают СВ χ 2:
s |
(ni - ni¢ ) |
2 |
|
χ 2 = å |
|
. |
|
ni¢ |
|
||
i=1 |
|
|
Она подчиняется распределению χ 2 с числом степенной свободы ν = s – r – 1, где s — число различных значений хi; r — число параметров, от которых зависит распределение. Для нормального за-
кона таких параметров два: a = x = M(X ) è σ = s = DÂ × |
n |
, ò.å. |
|
n -1 |
|
r = 2, è ν = s – 3. Если эмпирическое и теоретическое распределе- |
ния совпадают, то χ 2 = 0. По данному уровню значимости a и числу степеней свободы ν в таблице распределения χ 2 находят кри-
тическое значение χ êðèò2 . и определяют критическую область:
χ 2 < χêðèò2 |
., ω0 ={χ 2 : χ 2 ³ χêðèò2 .}. Затем вычисляют наблюдаемое |
||||||
значение χ 2, ò.å. χíàáë2 . по формуле |
|
|
|
||||
|
|
|
s |
(n |
|
- n¢ )2 |
|
|
χíàáë.2 |
|
å |
|
|
|
|
|
= |
|
i |
i . |
|||
|
|
|
i=1 |
|
|
ni¢ |
Если окажется, что χíàáë2 . < χêðèò2 . то нулевую гипотезу Н0 о том, что X имеет нормальное распределение, принимают. В этом слу- чае опытные данные выборки хорошо согласуются с гипотезо й о нормальном распределении генеральной совокупности.
340