Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тиун. рук-во.DOC
Скачиваний:
55
Добавлен:
11.04.2015
Размер:
2.02 Mб
Скачать

Если дисперсия несмещенной оценки при n→стремится к нулю, то такая оценка будет и состоятельной. Это следует из неравенства Чебышева (см.(8.2))Рдля случайной величины*.

Известно (см.(6.17)), что М(W)=р, Д(W)=, гдеWWn(A) есть относительная частота появления события А, а р – его вероятность. Первое равенство означает, что W есть несмещенная оценка р. Из второго равенства видно, что Д(W)0 при n. Тогда из сказанного в предыдущем абзаце следует, что эта оценка и состоятельна. Напомним, что это же утверждает и теорема Бернулли из законов больших чисел (см. (8.6)):

Можно доказать, что W является эффективной оценкой для р. Равенство (9.2) (сравните его с (10.2)) означает, что эмпирическая функция F*(х) есть состоятельная оценка для теоретической функции распределения F(х) данного признака Х. Величина F*(х) является и несмещенной оценкой для величины F(х).

Пусть генеральная средняя некоторого количественного признакаХ генеральной совокупности неизвестна. Рассматривая выборочную среднюю , можно доказать равенство

М() =. (10.3)

Равенство (10.3) утверждает, что выборочная средняя есть несмещенная оценка генеральной средней. На основании следствия из теоремы Чебышева показывается, что выборочная средняя является и состоятельной оценкой генеральной средней. В случае нормального распределения эта оценка также и эффективна.

Пусть теперь по данным повторной выборки объема n требуется оценить (найти приближенно) неизвестную генеральную дисперсию ДГ некоторого количественного признака. Рассматривая выборочную дисперсию ДВ как случайную величину DВ, можно установить равенство

М (DВ) = .

М (DВ)ДГ и, следовательно, ДВ есть смещенная оценка для ДГ. Так как , то при небольших объемах выборки выборочная дисперсия ДВ давала бы заниженные значения для ДГ. Чтобы получить несмещенную оценку для ДГ, надо выборочную дисперсию «исправить». Величина S2, определенная равенством

S2 = ДВ, (10.4) называется исправленной выборочной дисперсией. Очевидно, что М(S2)=ДГ. Так как , то при достаточно больших значенияхn объема выборки выборочная дисперсия ДВ и исправленная выборочная дисперсия S2 различаются мало и введение поправочного множителя теряет смысл. На практике исправленную оценку (10.4) применяют всегда, еслиn<30. Оценки ДВ и S2 являются состоятельными оценками ДГ. Оценка S2 для генеральной дисперсии ДГ не является эффективной.

При малых объемах выборки случайный характер точечной оценки * может привести к значительному расхождению между * и оцениваемым параметром . Тогда возникает задача о приближении параметра  не одним числом, а двумя числами 1*=1*(х1,…,хr) и 2*=2*(х1,…, хr) – концами интервала (1*, 2*), который покрывает наш неизвестный параметр : 1*<<2* или (1*, 2*). Такую оценку называют интервальной.

Параметр  есть некоторое вполне определенное число, хотя и неизвестное. В то же время 1* и 2* есть случайные величины. Поэтому событие

1*<  < 2* (или (1*, 2*)) есть случайное событие, что дает право говорить о вероятности  его появления:

 = Р(1*<  < 2*).

Эта вероятность  называется доверительной вероятностью или надежностью оценки . Соответствующий этой надежности  интервал (1*, 2*)I называется доверительным интервалом, а его случайные концы 1* и 2* - доверительными границами.

Обычно надежность оценки задается наперед, причем в качестве  берут число, близкое к 1. Наиболее часто принято считать, что 0,95. Это означает, что доверительный интервал I покрывает неизвестный параметр  с высокой вероятностью, т.е. событие 1*<  < 2* можно считать практически достоверным.

Пусть * есть статистическая оценка (обычно несмещенная) неизвестного параметра , найденная по данным выборки. Часто встречаются симметричные относительно * доверительные интервалы (*- , *+). Положительное число , являющееся радиусом интервала, характеризует точность оценки. Действительно, (*-; *+) означает *- <  < *+ или , т.е. есть предельная ошибка. Ясно, что чем меньше , тем оценка точнее.

Известно, что нормально распределенные случайные величины наиболее часто встречаются на практике (это объясняют центральные предельные теоремы теории вероятностей). Поэтому важно указать доверительные интервалы для параметров нормально распределенного признака Х генеральной совокупности. Остановимся на доверительных интервалах для оценки неизвестного математического ожидания М(Х)=а. При этом различают два случая: 1) среднее квадратическое отклонение (Х) исследуемого признака генеральной совокупности известно, 2) (Х) неизвестно.

Пусть среднее квадартическое отклонение =(Х) признака генеральной совокупности известно. Тогда вероятность события

(10.5) равна . Здесь - выборочная средняя,n- объем выборки, t – значение аргумента функции Лапласа

Ф(t) = ,

при котором Ф(t)=. Следовательно, интервал

(10.6)

с центром в случайной точке и радиусом, характеризующим точность оценки, будет доверительным интерваломI для математического ожидания а, отвечающим доверительной вероятности . В формулах (10.5) и (10.6) часто вместо t пишут t, так как этот аргумент определяется по выбранному : Ф(t)=. Значения аргументаt находятся по таблице указанной выше функции Лапласа.

Из равенства видно, что точность оценки (10.5) улучшается с увеличением объема n выборки. В силу равенства Ф(t)=с увеличением увеличится значение Ф(t). И так как функция Ф(t) возрастающая, то увеличится аргумент t. Тогда увеличится . Следовательно, с увеличением надежности  точность статистической оценки (10.5) уменьшается.

Интервальная оценка (10.5) для а называется классической. Она особенно важна при небольших объемах выборок.

Доказательство сформулированных утверждений основывается на следующем. Вероятность отклонения нормально распределенной случайной величины Х от ее центра М(Х)=а вычисляется по формуле

Р.

Выборочная средняя как случайная величина ХВ при независимых наблюдениях также распределена нормально со следующими параметрами:

М()=а,.

Заменяя в предыдущем равенстве Х на , получим

Р.

В силу обозначений t=или.

Оценка (10.5) предполагает известным среднее квадратическое отклонение  признака генеральной совокупности, которое на практике чаще всего бывает неизвестным. Если величину  в неравенствах (10.5) заменить ее приближенным значением s (исправленным средним квадратическим отклонением выборки, см.(10.4)), то надежность оценки (10.5) уменьшится. Поэтому при неизвестном  используют другой способ построения доверительного интервала для математического ожидания, основанный на использовании распределения Стьюдента (псевдоним английского статистика В.Госсета).

Случайная величина T, аргумент которой будем обозначать через t, называется t – распределением или распределением Стьюдента, если плотность распределения вероятностей (дифференциальная функция) f(t) имеет вид

f(t) = , (10.7)

где Г(z) – известная гамма-функция:

Г(z) =

(несобственный интеграл Эйлера, сходящийся при любом z >0). Распределение (10.7) содержит один параметр k, называемый еще числом степеней свободы.

Пусть количественный признак Х генеральной совокупности распределен нормально с параметрами а=М(Х) и 2=Д(Х), которые неизвестны. Извлечем выборку объема n. Пусть - выборочная средняя иS=- исправленное среднее квадратическое отклонение как случайные величины. Можно доказать, что случайная величина Т=подчинена распределению Стьюдента (10.7) сk=n-1 степенями свободы. Из формулы (10.7) видно, что в случае такой случайной величины Т ее распределение определяется одним параметром k=n-1 (или объемом n выборки) и не зависит от неизвестных параметров а и . Это позволяет найти доверительный интервал I:

I = , (10.8) покрывающий неизвестный параметра при неизвестном  с надежностью . В формуле (10.8) иS находятся по данным выборки, а t находится в специальной таблице по заданному  при данном объеме выборки (см. приложения 3 и 6 из [5]).

Р е ш е н и е т и п о в ы х з а д а ч

Задача 1. Для определения точности измерительного прибора, систематическая ошибка которого практически равна нулю, было произведено пять независимых измерений и получены следующие результаты в метрах:

2 781, 2 836, 2 807, 2 858, 2 763. Определить несмещенную оценку для дисперсии ошибок измерительного прибора, если значение измеряемой величины неизвестно.

Решение. Когда значение измеряемой величины неизвестно, ее подходящее значение определяется по формуле (9.3)

=(м).

Несмещенная оценка для дисперсии в этом случае вычисляется по формуле (10.4):

S2=

Задача 2. Среднее значение высоты полета самолета, полученное по независимым измерениям четырех высотометров, равно 10250 м. Средняя квадратическая ошибка одного любого высотометра =25 м. Найти с надежностью 95% доверительный интервал для оценки высоты полета самолета, если ошибки измерения высотометрами распределены нормально.

Решение. Доверительный интервал для неизвестной высоты полета самолета определяется по формуле (10.6). В данном случае =0,95; n=4; =25; =10250. Значениеt, при котором Ф(t)==0,475, находим из[5] (приложение 2): t=1,96. Отсюда ==24,5.

Следовательно, искомым доверительным интервалом будет интервал

(10 250м – 24,5м; 10 250м + 24,5м) или (10 225,5м; 10 274,5м).

Задача 3. Из большой партии электрических лампочек произведена малая выборка. Продолжительность горения лампочек в выборке следующая:

Номер

Лампочки

1

2

3

4

5

6

7

8

9

Время

горения

в часах

1 220

1 240

1 310

1 290

1 330

1 260

1 360

1 270

1 210

Определить доверительный интервал, в котором может быть заключено среднее время горения электролампочки и гарантировать эти границы с вероятностью 0,98.

Решение. Так как величина Г неизвестна, то применяется формула (10.8). Определим среднюю выборочную по формуле (9.3):

=

Определяем исправленное среднее квадратическое отклонение S по формуле (10.4):

=

ДВ = 1 632 144,444 – (1 276,67)2  2 258,1 564;

S =

В приложении 6 из [5] по числу степеней свободы k=n-1=8 и доверительной вероятности =0,98 находим t=2,9. Подставляя полученные значения в формулу (10.8), найдем границы доверительного интервала для генеральной средней:

-

+

Таким образом, с надежностью 0,98 средняя продолжительность горения электролампочки всей партии заключена в интервале (1 227,95; 1 325,39).

З а д а ч и

  1. После 7 заездов автомобиля на определенной трассе были получены следующие значения его максимальной скорости (в м/с): 36, 29, 40, 38, 35, 41, 37. Определить несмещенные оценки генеральной средней и генеральной дисперсии для максимальной скорости автомобиля.

  2. Для определения глубины водоема с помощью измерительного прибора, систематическая ошибка которого практически равна нулю, было произведено шесть независимых измерений и получены следующие результаты в сантиметрах: 428, 442, 430, 438, 441, 425. Определить несмещенные оценки генеральной средней и генеральной дисперсии глубины водоема.

  3. Среднее значение расстояния до ориентира по пяти независимым измерениям равно 5250 м. Среднеквадратическая ошибка измерительного прибора =40 м, систематическая ошибка отсутствует. Найти с надежностью 99% доверительный интервал для измеряемой величины, считая, что ошибки измерения распределены нормально.

  4. Средняя выработка 16 рабочих составила 24 детали за смену. Среднее квадратическое отклонение Г=1,1. Определить, в каких границах будет находиться средняя суточная выработка всех рабочих данной специальности, если результат необходимо гарантировать с вероятностью 0,97. Распределение выработки всех рабочих данной специальности предполагается нормальным.

  5. В результате измерения веса 500 электрических нагревательных спиралей получены следующие данные в миллиграммах:

Вес

Спирали

38,0

38,5

39,0

39,5

40,0

40,5

41

41,5

42

42,5

43

43,5

44

Число

Спиралей

2

3

10

31

72

85

94

88

62

37

12

3

1

Найти с надежностью =0,99 доверительный интервал для оценки веса спирали, если ошибки при взвешивании подчинены нормальному закону распределения.

  1. Произведена малая выборка при измерении диаметров деревьев в возрасте 20 лет на расстоянии 1 м от земли. Данные выборки следующие:

Номер стволов

1

2

3

4

5

6

7

8

9

10

Диаметр (см)

40

37

36

41

43

38

35

39

41

37

Определить, в каких пределах будет заключен диаметр 20-летнего дерева, если результат необходимо гарантировать с вероятностью 0,98. Предполагается, что диаметр деревьев данного возраста подчиняется нормальному закону.

  1. Глубину моря измеряют прибором, случайные ошибки которого распределены нормально со средним квадратическим отклонением Г=10 м. Систематическая ошибка отсутствует. Сколько надо сделать независимых измерений, чтобы с надежностью 95% определить глубину с точностью 5 м?