- •Глава 1. Закон больших чисел (предельные теоремы)
- •§ 1. Основные понятия и формулы
- •1. Неравенство Маркова
- •2. Неравенство Чебышева
- •3. Неравенство Бернулли
- •4. Теорема Чебышева для последовательности независимых св
- •5. Частный случай
- •§ 2. Решение типовых задач
- •§ 3. Задачи для самостоятельного решения
- •Глава 2. Нормальная случайная величина
- •§ 1. Основные понятия и формулы
- •§ 2. Решение типовых задач
- •§ 3. Задачи для самостоятельного решения
- •Глава 3. Точечные оценки неизвестных параметров
- •§ 1. Основные методы нахождения оценок неизвестных параметров
- •§ 1.1 Метод моментов Пирсона
- •§ 1.2. Метод максимального правдоподобия Фишера
- •§ 2. Решение типовых задач
- •Решение задачи (метод моментов)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод моментов Пирсона)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод максимального правдоподобия)
- •Решение задачи (метод максимального правдоподобия)
- •§ 3. Задачи для самостоятельного решения
- •Глава 4. Построение доверительных интервалов для параметров распределения генеральной совокупности
- •§1. Схема построения доверительных интервалов
- •§2. Решение типовых задач
- •§3. Задачи для самостоятельного решения
- •Глава 5. Проверка статистических гипотез. Критерий значимости
- •§1. Схема применения критерия значимости. Ошибки I и II рода
- •Для левосторонней гипотезы:
- •§2. Решение типовых задач
- •§3. Задачи для самостоятельного решения
- •Глава 6. Проверка гипотезы о законе распределения генеральной совокупности (критерий согласия)
- •§1. Схема применения критерия согласия
- •§2. Решение типовых задач (проверка гипотезы о виде распределения генеральной совокупности. Критерий Пирсона )
- •§3. Задачи для самостоятельного решения
- •Глава 7. Методический материал для написания эссе
- •§1. Методические рекомендации по написанию эссе
- •Упрощенный критерий проверки
- •Более обоснованный критерий проверки
- •1 Задача: о равенстве математических ожиданий.
- •2 Задача: о равенстве вероятностей двух событий.
- •§2. Образец написания эссе
- •I. Проверка гипотезы о равенстве мо из любых гс в случае больших выборок
- •II. Проверка гипотезы о равенстве вероятностей двух событий с помощью доверительного интервала при большом объеме выборки
- •Глава 8. Приложения
- •§1. Понятие о квантилях
- •§2. Основные распределения в статистике
- •1. Распределение χ2 с «k» степенями свободы
- •2. Распределение Стьюдента с “k” степенями свободы
- •3. Распределение Фишера с и степенями свободы
- •§3. Статистические таблицы
§2. Решение типовых задач (проверка гипотезы о виде распределения генеральной совокупности. Критерий Пирсона )
Постановка задачи
Пусть x1,x2,…xn – выборка наблюдений случайной величины Х. Проверяется гипотеза : Х имеет распределение F(x).
Проверка гипотезы при помощи критерия осуществляется по следующей схеме:
Если есть неизвестные параметры, то по выборке находят точечные оценки этих параметров (метод моментов, метод максимального правдоподобия или другие известные методы).
Область возможных значений Х разбивают на “k” множеств (если Х – дискретная СВ – то это значения СВ, если Х – непрерывная СВ – то это интервалы).
Пусть - число элементов выборки, принадлежащих множеству i ( ).
Используя предполагаемый закон распределения Х находят вероятности . ={Xi} i=1,2,…,k. ( ). Все данные заносятся в таблицу. Выборочное значение статистики критерия вычисляется по формуле
Задается уровень значимости и вычисляется критическая точка – порог испытаний: - квантиль распределения порядка (1-), где r (число степеней свободы)=k-1-l (k – число интервалов, l – число неизвестных параметров).
Строим критическую область
Правило принятия решения: Если , то гипотезу Но о виде распределения СВ Х принимаем на уровне значимости , а в противном случае – отвергаем.
Задача 1 (см. задача №1 «Точечные оценки»)
Х имеет распределение, заданное таблицей. Неизвестные параметры a и b. Точечные оценки: (n=50).
|
-1 |
0 |
2 |
4 |
|
2a |
a |
b |
1-3a-b |
0,32 |
0,16 |
0,43 |
0,09 |
|
|
15 |
10 |
20 |
5 |
: Х – имеет данное распределение. Проверить данную гипотезу на уровне значимости =0,1, используя критерий согласия Пирсона.
Заполним следующую таблицу:
№ |
|
|
|
n |
|
1 |
-1 |
0,32 |
15 |
16 |
0,0625 |
2 |
0 |
0,16 |
10 |
8 |
0,5 |
3 |
2 |
0,43 |
20 |
21,5 |
0,07 |
4 |
4 |
0,09 |
5 |
4,5 |
0,05 |
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=4, l(число неизвестных параметров)=2) r=1.
Н айдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (0,68<2,71), то гипотезу на уровне значимости =0,1 принимаем.
Задача 2 (Биномиальное распределение см. задачу №2 «Точечные оценки»)
А – шкатулка с деньгами была отгадана. Р(А)=р. Была получена оценка (n=20). Но: проверить гипотезу о биномиальном распределении на уровне значимости =0,1 (неизвестен один параметр, т.е. l=1).
Составим таблицу:
№ |
|
|
|
n |
|
1 |
0 |
|
6 |
6,86 |
0,1 |
2 |
1 |
|
9 |
8,82 |
0,0037 |
3 |
2 |
|
4 |
3
4,32
|
0,1 |
4 |
3 |
|
1 |
0,54 |
|
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=3, l(число неизвестных параметров)=1) r=1.
Н айдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (0,2<2,71), то гипотезу о биномиальном распределении на уровне значимости =0,1 принимаем.
Задача 3 (Распределение Пуассона см. задачу №3 «Точечные оценки»)
Была получена точечная оценка параметра : ( - количество ошибок в одном пакете) при n=100 (неизвестен один параметр, т.е. l=1).
: на уровне значимости =0,1 проверить гипотезу о том, что Х – имеет распределение Пуассона.
Составим таблицу:
№ |
|
|
|
n |
|
1 |
0 |
|
22 |
20 |
0,2 |
2 |
1 |
|
30 |
32 |
0,125 |
3 |
2 |
|
25 |
26 |
0,038 |
4 |
3 |
|
15 |
14 |
0,07 |
5 |
4 |
|
5 |
5 ,6 |
1,125 |
6 |
5 |
|
2 |
1,8 |
|
7 |
6 |
|
1 |
0,6 |
|
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=1) r=3.
Н айдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (1,558<6,25), то гипотезу Но о распределении Пуассона на уровне значимости =0,1 принимаем.
Задача 4 (дискретное равномерное распределение)
На экзамене студент отвечает только на один вопрос по одной из трех частей курса «Теории вероятности». Экзамен сдавали 60 студентов, при этом : 23 студента получили вопрос из I части, 15 студентов получили вопрос из II части, 22 студента получили вопрос из III части. Можно ли утверждать, что студент, идущий на экзамен, с равной вероятностью получит вопрос из любой части.
Проверяем гипотезу : равномерное распределение (дискретное). Пусть уровень значимости =0,1. Используем критерий .
Составим таблицу:
№ |
|
|
|
n |
|
1 |
I часть |
1/3 |
23 |
20 |
0,45 |
2 |
II часть |
1/3 |
15 |
20 |
1,25 |
3 |
III часть |
1/3 |
22 |
20 |
0,2 |
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=3, l(число неизвестных параметров)=0) r=2.
Найдем порог испытания (квантиль распределения .
С троим критическую область:
Правило принятия решения: Т.к. (1,9<4,61), то гипотезу Но на уровне значимости =0,1 принимаем.
Задача 5 (равномерное распределение на отрезке)
Наблюдалось следующее распределение по минутам числа появлений на остановке автобуса, имеющего пятиминутный интервал движения.
Интервал в минутах |
Число появлений автобуса |
[0;1) |
35 |
[1;2) |
34 |
[2;3) |
38 |
[3;4) |
36 |
[4;5) |
42 |
Проверить гипотезу о равномерном распределении (при =0,05)
:
Примечание:
По предположению: a=0 и b=5
Составим таблицу (n=185):
№ |
Границы интервалов |
|
|
n |
|
1 |
[0;1] |
|
35 |
37 |
4/37 |
2 |
[1;2) |
|
34 |
37 |
9/37 |
3 |
[2;3) |
|
38 |
37 |
1/37 |
4 |
[3;4) |
|
36 |
37 |
1/37 |
5 |
[4;5] |
|
42 |
37 |
25/37 |
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=0) r=4.
Найдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (1,08<9,49), то нет оснований отклонить гипотезу о равномерном распределении Х на [0;5].
Задача 6 (показательное распределение)
Срок службы батареек для слуховых аппаратов - это случайная величина Х. : Х – имеет показательное распределение с параметром . Для нахождения точечной оценки параметра была составлена группированная выборка ( - число работающих батареек в течении четырех месяцев). N=200.
№ |
Границы интервалов |
- середины интервалов |
|
1 |
[0;4) |
2 |
115 |
2 |
[4;8) |
6 |
50 |
3 |
[8;12) |
10 |
20 |
4 |
[12;16) |
14 |
10 |
5 |
[16;20] |
18 |
5 |
Используем метод моментов для нахождения точечной оценки :
Составляем уравнение :
=0,05
H o:
Примечание:
Составим таблицу:
№ |
Границы интервалов |
|
|
n |
|
1 |
[0;4) |
|
115 |
110 |
0,227 |
2 |
[4;8) |
|
50 |
48 |
0,083 |
3 |
[8;12) |
|
20 |
24 |
0,66 |
4 |
[12;16) |
|
10 |
10 |
0 |
5 |
[16;∞] |
|
5 |
8 |
1,125 |
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=1) r=3.
Найдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (2,1<7,81), то нет оснований отклонить гипотезу о показательном распределении.
Задача 7 (Нормальное распределение)
В нескольких школах сделали случайную выборку школьниц (n=100) и измерили их рост. Х – рост девушек в возрасте 16 лет (см).
Была составлена следующая группированная выборка:
№ |
Границы интервалов |
- середины интервалов |
|
1 |
[140;144) |
142 |
2 |
2 |
[144;148) |
146 |
4 |
3 |
[148;152) |
150 |
10 |
4 |
[152;156) |
154 |
14 |
5 |
[156;160] |
158 |
25 |
6 |
[160;164) |
162 |
35 |
7 |
[164;168) |
166 |
8 |
8 |
[168;172] |
170 |
2 |
Выдвигается гипотеза: : .
Т.к. параметры неизвестны, то найдем точечные оценки по методу моментов:
Составляем уравнение:
: =0,05
Составим таблицу
№ |
интервалы |
|
|
n |
|
1 |
[ -∞;144) |
0,006 |
2 |
0 ,6 |
0,42 |
2 |
[144;148) |
0,029 |
4 |
2,9 |
|
3 |
[148;152) |
0,101 |
10 |
10,1 |
|
4 |
[152;156) |
0,216 |
14 |
21,6 |
2,67 |
5 |
[156;160) |
0,281 |
25 |
28,1 |
0,34 |
6 |
[160;164) |
0,22 |
35 |
2 |
7,68 |
7 |
[164;168) |
0 ,109 |
8 |
1 0,9 |
1,5 |
8 |
[168;+∞) |
0,038 |
2 |
3,8 |
|
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=2) r=2.
Найдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (12,6>5,99), то гипотезу о нормальном распределении Х отвергаем на уровне =0,05.
Задача 8( распределение Парето)
Проводилось исследование величины доходов Х населения поселка N выше фиксированного уровня xo =3(минимальная заработная плата).
Была сделана выборка объема n=50 и составлена группированная выборка. Выдвигается гипотеза : Х – имеет распределение Парето.
Т.к. параметр неизвестен, то найдем точечную оценку, используя метод моментов.
№ |
Границы интервалов |
- середины интервалов |
|
1 |
[3;3,4) |
3,2 |
20 |
2 |
[3,4;3,8) |
3,6 |
15 |
3 |
[3,8;4,2) |
4,0 |
8 |
4 |
[4,2;4,6) |
4,4 |
4 |
5 |
[4,6;5,0] |
4,8 |
2 |
6 |
[5,0;5,4) |
5,2 |
1 |
По методу моментов найдем точечную оценку параметра :
Составляем уравнение :
На уровне значимости 0,05 проверить гипотезу :
Примечание:
Вычисляем вероятности попадания в данные интервалы:
№ |
интервалы |
|
|
n |
|
1 |
[3;3,4) |
0,504 |
20 |
25,2 |
1,07 |
2 |
[3,4;3,8) |
0,23 |
15 |
11,5 |
1,06 |
3 |
[3,8;4,2) |
0,116 |
8 |
5,8 |
0,83 |
4 |
[4,2;4,6) |
0,06 |
4 |
3 |
0,03 |
5 |
[4,6;5,0) |
0,033 |
2 |
1
7,5 |
|
6 |
[5;+∞) |
0,057 |
1 |
2,85 |
|
|
|
|
|
|
|
Найдем число степеней свободы: r =k-1-l (k(число интервалов)=4, l(число неизвестных параметров)=2) r=2.
Найдем порог испытания (квантиль распределения .
Строим критическую область:
Правило принятия решения: Т.к. (2,99<5,99), то нет оснований отвергнуть гипотезу о том, что величина доходов населения выше уровня 3 минимальных зарплат распределена по закону Парето.
Задача 8
Пусть СВ Х имеет следующее распределение:
Найти:
Точечные оценки параметров a и k по случайной выборке по методу максимального правдоподобия
Точечные оценки по данной группированной выборке
Проверить гипотезу : Х имеет данное распределение (при =0,05).
Решение
Найдем формулу связи между параметрами, используя основное свойство функции плотности:
Используем метод максимального правдоподобия:
(Х1,Х2,…Хn) – случайная выборка. Составим функцию правдоподобия:
Необходимое условие экстремума:
Для дальнейших вычислений нам понадобится функция распределения F(x)=