Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по ТВ Евдокимова.doc
Скачиваний:
225
Добавлен:
01.05.2015
Размер:
5.34 Mб
Скачать

Точечные и интервальные оценки

Смоленск 2009

Оценки параметров генеральной совокупности, полученные на основании выборки, называются статистическими. Если статистическая оценка характеризуется одним числом, она называется точечной.

Выборочная средняя определяется как среднее арифметическое полученных по выборке значений:

Для устранения смещённости выборочной дисперсии её умножают на величину n /(n - 1) и получают

Величину называютнесмещенной или «исправленной» выборочной дисперсией.

В некоторых случаях для удобства расчётов при определении статистических оценок переходят к условным вариантам. Например, если варианты - большие числа, то используют разности

где С – произвольно выбранное число (ложный нуль), такое, при котором условные варианты принимают небольшие значения.

В этом случае

Для изменения значения варианты можно ввести также условные варианты путём использования масштабного множителя:

где (b выбирается положительным или отрицательным целым числом).

Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка.

Метод наибольшего правдоподобия, применяемый для определения точечной оценки, опирается на использование условий экстремума функций одной или нескольких случайных величин. В качестве такой функции принимают функцию правдоподобия.

Для дискретной случайной величины функция правдоподобия принимает вид

где варианты выборки;

параметр, для которого находится оценка;

вероятность события X = xi, зависящая от параметра ;

заданная функция плотности вероятности в точках xi..

Так как функции L и lnL достигают максимума при одном и том же значении , то обычно точки экстремума находятся дляlnL. Для этого определяется производная и приравнивается к нулю.

Если статистическая оценка параметров закона распределения случайной величины Х характеризуется двумя числами – концами интервала, то такая оценка называется интервальной.

Интервал, в который попадает оцениваемый параметр с заданной надёжностью (вероятностью), называется доверительным. Доверительный интервал применяется в случае сравнительно небольшого объёма выборки, когда предполагается, что надёжность точечной оценки может быть невысокой.

Доверительный интервал для оценки математического ожидания случайной величины Х с заданной надёжностью γ в случае нормального закона распределения определяется на основе неравенств

где z – значение аргумента функции Лапласа, получаемое из

таблицы (см. Приложение), с учётом того, что

известное среднее квадратичное отклонение или его

оценка;

n – объём выборки.

Доверительный интервал для оценки среднего квадратичного отклонения случайной величины X с надёжностью γ для нормального закона распределения случайной величины находится из неравенств

где s – несмещённое значение выборочного среднего квадра-

тичного отклонения;

q – параметр, который находится по таблице (см. Приложение) на основе известного значения объёма выборки n и заданной надёжности оценки γ.

Цель занятия: 1. Добиться усвоения простейших навыков построения точечных и интервальных оценок. Обратить внимание студентов на случайный характер получаемых оценок, на проявление закона больших чисел, если наблюдений много.

  1. Закрепить в сознании студентов соответствие между понятиями прикладной и математической статистики:

В задачах 5 и 6 четко провести разграничение методов построения доверительного интервала.

К занятию по данной теме должны быть подготовлены ответы на следующие вопросы:

  1. В чем заключается сущность задачи нахождения точечных оценок неизвестных параметров распределения?

  2. Что называется доверительным интервалом? доверительной вероятностью?

  3. Что называется предельной погрешностью точечной оценки параметра?

  4. Что происходит с длиной доверительного интервала при увеличении объема выборки? увеличении доверительной вероятности?

  5. Являются ли концы интервалов постоянными величинами? Случайными величинами?

Задача 1. В итоге 8 измерений некоторой физической величины одним и тем же прибором получены следующие результаты: x1=50,3; x2=50,1; x3=50,4; x4=49,9; x5=50,0; x6=50,2; x7=50,8; x8=50,7. В предположении, что систематическая ошибка отсутствует, найти оценку измеряемой величины и оценку дисперсии ошибки прибора.

Решение. Результаты измерений Х можно представить в виде Х = +Y, где – измеряемая физическая величина, а Y – ошибка измерения. Из предположения об отсутствии систематической ошибки следует, что M(Y) = 0 и M(X)=M()+M(Y)=. Поэтому для оценки можно использовать оценку математического ожидания, т.е. среднее арифметическое

=

Так как D(X)=D()+D(Y)=D(Y), представление об ошибке прибора дает несмещенная оценка дисперсии.

Задача 2. В табл.4 приведены сгруппированные данные измерений роста у 50 случайно отобранных студентов.

Таблица 4.

Рост студентов, см

162-166

166-170

170-174

174-178

178-182

182-186

Число студентов

3

7

15

13

11

1

Оценить средний рост и дисперсию роста студентов.

Решение. Так как данные сгруппированы, то в качестве представителя каждой группы можно взять середину интервала. Тогда

S = 4,87.

Задача 3. Известно, что число независимых опытов до первого появления события имеет геометрический закон распределения:

X

1

2

3

k

P

P

qp

q2p

qk-1p

где p – неизвестный параметр, который равен вероятности появления события в одном опыте, q = 1 – p. Проделано 5 серий опытов до первого появления события. Они дали следующие результаты: x1=10, x2=4, x3=2, x4=11, x5=3. Найти оценку наибольшего правдоподобия для р. Оценить р по методу моментов.

Решение. Найдем функцию правдоподобия в общем случае

Тогда

В нашем случае .Значит . По методу моментов получается та же оценка, так как А оценкой является .

Задача 4. Для обследования крупной парии изделий отобрано наугад 900 штук. Проверка показала, что среди них 810 стандартны. Построить доверительный интервал для доли стандартных изделий в партии. Уровень надёжности выбрать равным 0,95.

Решение. Пусть доля стандартных изделий в партии равна p. Оценкой её может служить величина По таблице функции Лапласанаходим такоечтобыТогда по формуле

.

Задача 5. По данным задачи 2, построить доверительный интервал для среднего роста студентов с надёжностью 0,9.

Решение. По таблице функции находим значениедля которогоТогда по формуле

находим

или

Задача 6. Измерения сопротивления резистора дали следующие результаты (в омах)

Известно, что ошибки измерения имеют нормальный закон распределения. Систематическая ошибка отсутствует. Построить доверительный интервал для истинного сопротивления резистора с надёжностью 0,99 в предположении:

а) дисперсия ошибки измерения известна и равна 4;

б) в предположении неизвестной ошибки измерения.

Решение. Результаты измерения можно представить в видеX = a + Y, где a - истинное значение измеряемой величины, а Y - ошибка измерения. Систематическая ошибка отсутствует (M(Y)=0), поэтому M(X)=M(a)+M(Y)=a и D(X)=D(a)+D(Y)=D(Y), т.е. доверительный интервал для M(X) будет доверительным интервалом для истинного значения сопротивления резистора. В данной серии наблюдений

Если дисперсия известна, то доверительный интервал можно построить, используя устойчивость нормального закона распределения. Так как и,

то , откуда

Из таблицы функции Лапласа находим, что. Тогдаили

В результате

или

.

В случае неизвестной дисперсии, её оценку можно получить на основе тех же опытных данных

.

По таблице распределения Стьюдента для степеней свободы и заданной вероятностинаходим такое, что

.

Отсюда

,

.

Задача 7. По данным выборки объёма n = 25 найдено несмещённое значение выборочного среднего квадратичного отклонения s = 3 нормально распределённой случайной величины Х. Найти с надёжностью 0,99 доверительный интервал для оценки среднего квадратичного отклонения случайной величины.

Решение. На основании данных значений γ = 0,99, n = 25 по таблице (см. Приложение) находим значение q = 0,49. Подставляем в неравенства

откуда

Задача 8. На основании выборочных наблюдений производительности труда 20 работниц было установлено, что среднее квадратическое отклонение суточной выработки составляет 15 м ткани в час. Предполагая, что производительность труда работницы имеет нормальное распределение, найти границы, в которых с надёжностью 0,9 заключены генеральные дисперсия и среднее квадратическое отклонение суточной выработки работниц.

Решение. Имеем γ = 0,9; (1 – γ)/2 = 0,05. (1+ γ)/2 = 0,95.

При числе степени свободы k = n – 1 = 20 – 1 = 19 определим и по таблице (см. Приложение) для вероятностей 0,95 и 0,05, т.е. иТогда доверительный интервал дляможно записать в виде:

или и для:или(м/ч).

Итак, с надёжностью 0,9 дисперсия суточной выработки работниц заключена в границах от 149,5 до 445,6, а её среднее квадратическое отклонение – от 12,2 до 21,1 метров ткани в час.

Дополнительные задачи.

Задача 1. Найти несмещённую и состоятельную оценку доли рабочих цеха с выработкой не менее 124% по выборке, представленной в таблице 1 (предыдущего урока).

Решение. Несмещенной и состоятельной оценкой генеральной доли является выборочная доля

Задача 2. Найти выборочную среднюю по данному распределению выборки:

xi

1450

1480

1490

ni

3

5

2

Решение. Так как выборочные значения – большие числа, то целесообразно ввести условные варианты. В качестве ложного нуля выбираем С = 1470 и рассчитываем ui по формуле

xi

-20

10

20

ni

3

5

2

Определяем выборочную среднюю:

После этого находим

Задача 3. Найти выборочную дисперсию по данному распределению выборки:

xi

0,02

0,05

0,08

ni

3

2

5

Решение. В целях упрощения расчётов целесообразно перейти к условным вариантам

xi

2

5

8

ni

3

2

5

Найдём выборочную дисперсию условных вариант:

Выборочная дисперсия данного распределения вариант xi находится на основе выражения

Задача 4. На предприятии изготавливается определённый вид продукции. Ежемесячный объём выпуска этой продукции является случайной величиной, для характеристики которой принят показательный закон распределения

В течение шести месяцев проводился замер объёмов выпуска продукции, получены следующие данные:

Месяц

1

2

3

4

5

6

Объём выпуска

20

24

25

28

27

32

Найти оценку параметра λ.

Решение. Так как закон распределения содержит лишь один параметр λ, то для его оценки требуется составить одно уравнение.

Находим выборочную среднюю:

Определяем математическое ожидание:

Интегрируя по частям, получаем

откуда

Полученное равенство является приближённым, так как правая часть его является случайной величиной. Таким образом, из уравнения получается не точное значение λ , а его оценка :

Итак, откуда

Задача 5. Случайная величина Х (время безотказной работы элемента) имеет показательное распределение Ниже приведено эмпирическое распределение среднего времени работы1000 элементов (в первой строке указано среднее время xi безотказной работы одного элемента в часах; во второй строке указана частота ni – количество элементов, проработавших в среднем xi часов):

xi

5

15

25

35

45

55

65

ni

365

245

150

100

70

45

25

Найти методом наибольшего правдоподобия точечную оценку неизвестного параметра λ показательного распределения.

Решение. Составим функцию правдоподобия

учитывая, что и, следовательно,

Найдём логарифмическую функцию правдоподобия:

Найдём первую производную по λ:

Запишем уравнение правдоподобия, для чего приравняем первую производную к нулю: Найдём критическую точку, для чего решим полученное уравнение относительно λ:

Найдём вторую производную по λ:

Легко видеть, что при вторая производная отрицательна; следовательно, это точка есть точка максимума и, значит, в качестве оценки наибольшего правдоподобия надо принять величину, обратную выборочной средней:

Так как

то

Домашнее задание.

Задача 1. Выручка в магазине от продажи обуви составила соответственно по месяцам следующие значения (млн. руб.):

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

P

0,2

0,5

0,4

0,2

0,4

0,5

0,2

0,2

0,4

0,5

0,4

0,2

Найти выборочную среднюю и выборочную дисперсию.

Задача 2. При условии показательного распределения случайной величины X

произведена выборка

xi

4

3

10

12

15

ni

3

3

6

4

4

Найти оценку параметра λ методом моментов.

Задача 3. Стеклянные однородные изделия отправлены для реализации из Москвы в Новосибирск в 1000 контейнерах. После поступления товара было выявлено количество разбитых изделий в каждом контейнере. Результаты представлены в таблице:

xi

0

1

2

3

4

ni

785

163

32

16

4

Считая, что число разбитых изделий описывается законом Пуассона, найти точечную оценку параметра λ .

Задача 4. Найти доверительный интервал с надёжностью 0,8 для оценки математического ожидания нормально распределённой случайной величины Х со средним квадратичным отклонением выборочной среднейи объёмом выборкиn = 25.

Задача 5. В нескольких мелких магазинах проведена проверка качества 100 изделий, после чего осуществлена обработка полученных данных. В результате получено несмещённое значение выборочного среднего квадратичного отклонения s = 4. Считая распределение качественных изделий нормальным, найти с надёжностью 0,95 доверительный интервал для оценки среднего квадратичного отклонения.

Ответы: 1) 2)3)4)(18,72; 21,28). 5) (3,5; 4,67).

СМОЛЕНСКИЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ

Г. С. ЕВДОКИМОВА

ПРАКТИКУМ

ПО ТЕОРИИ ВЕРОЯТНОСТЕЙ

И МАТЕМАТИЧЕСКОЙ

СТАТИСТИКЕ

МОДУЛЬ 9–10