- •Часть II Математическая статистика введение
- •§ 1. Задачи статистики. Понятие выборки
- •§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
- •0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
- •§ 3. Точечные оценки
- •3.1Определение оценки и ее качество
- •3.2 Оценки моментов
- •3.3 Оценка функции распределения (эмпирическая функция распределения)
- •3.4 Оценка плотности распределения (гистограмма)
- •§ 4. Точечные оценки параметров распределения
- •4.1 Метод моментов
- •4.2 Метод максимального (наибольшего) правдоподобия
- •§ 5. Понятие интервальной оценки
- •5.1 Основные понятия
- •5.2 Доверительные интервалы для параметров нормального распределения
- •5.2.1Интервальные оценки для математического ожидания при известной дисперсии
- •5.2.2 Интервальные оценки математического ожидания при неизвестной дисперсии
- •5.2.3 Интервальные оценки дисперсии (среднеквадратического отклонения) при известном математическом ожидании
- •5.2.4 Интервальные оценки дисперсии (среднеквдратического отклонения) при неизвестном математическом ожидании
- •§ 6. Проверка статистических гипотез
- •6.1 Основные понятия
- •6.2 Гипотезы о математическом ожидании нормально распределенной генеральной случайной величины
- •6.3 Критерии согласия для предполагаемого закона распределения
- •6.3.1 Критерий согласия (критерий Пирсона)
- •6.3.2 Критерий Колмогорова
6.3 Критерии согласия для предполагаемого закона распределения
Не всегда есть основания высказывать альтернативную гипотезу в явном виде. Тогда выдвигается основная гипотеза а конкурирующая гипотеза содержит отрицание Например:
выборки двух генеральных случайных величин, имеющих равные дисперсии;
выборки двух случайных величин, имеющих не равные дисперсии.
В этом случае проверка гипотезы состоит в выявлении того, согласуется ли высказанное в гипотезе предложение с выборочными наблюдениями Такие критерии называются критериями согласия.
Рассмотрим основные гипотезы относительно закона распределения:
выборка извлечена из совокупности, имеющей распределение с функцией
Причем параметры могут быть указаны все или только некоторые из них. Вместо функции распределения может быть указан вид закона распределения или плотность.
Рассмотрим критерий согласия и критерий Колмогорова.
6.3.1 Критерий согласия (критерий Пирсона)
Пусть выборка случайной величины Х. На основе обработки данных мы можем выдвинуть предположения о функции распределения генеральной случайной величины. Например, после построения гистограммы проводится сравнение с общими видами графиков плотностей распределения известных законов. Если высоты прямоугольников приблизительно одинаковые, то можно предположить, что генеральная случайная величина распределена равномерно.
Итак, с заданным уровнем значимости нужно проверить гипотезу генеральная совокупность имеет функцию распределения
Определим этапы проверки гипотезы:
1 этап. Разобьем промежуток изменения выборочных данных на r интервалов без общих точек. Число членов выборки, попавших в i-ый интервал, обозначим Величина показывает эмпирическую вероятность попадания в i-ый интервал. Значение называют еще эмпирической частотой попадания в i-ый интервал.
2 этап. Предположив справедливость гипотезы вычисляем теоретическую вероятность попадания в i-ый интервал: При подсчете теоретических вероятностей есть определенные правила:
а) В гипотезе указан вид распределения, но не все параметры указаны. Пусть неизвестные параметры Далее сохраним обозначение s – число оцененных параметров. В роли значений параметров выступают их оценки (заметим, что в роли оценок не всегда выступают оценки, приведенные в §4).
б) Объединение интервалов разбиения должно покрывать всё множество значений генеральной случайной величины: В противном случае проводится корректировка первого и последнего интервалов
3 этап. Находятся теоретические частоты Если для некоторых интервалов то их объединяют с соседними так, чтобы в итоге для каждого интервала теоретическая частота была больше 5. При объединении интервалов их эмпирические частоты складываются. Новое число интервалов обозначается
4 этап. За меру отклонения выборки от гипотетического распределения принимают:
-
(6.3.1)
Значение критерия вычисленное по выборочным данным, обозначим
5 этап. При выполнении гипотезы выборочным распределением будет распределение с степенью свободы. Для нахождения критической точки используем таблицу 3: по и находим . Критической областью является
6 этап. Если то принимаем гипотезуКонечно, абсолютно истинной гипотезуне считаем.
Если то гипотезуотвергаем.
Пример 1. Даны эмпирические и теоретические частоты попадания в каждый интервал разбиения. Используя критерий при уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной случайной величины Х.
-
5
10
20
8
7
6
14
18
7
5
Здесь подсчет теоретических и эмпирических частот произведен. Гипотеза генеральная совокупность нормально распределена. Тогда число оцененных параметров Оценки параметров а и заранее вычислены, и с их использованием найдены Число интервалов Объем выборки
Найдем
Определим критическую точку. Используем таблицу 3: при и числе степеней свободы имеем
Итак, и тогда и нет оснований отвергать гипотезу о нормальном распределении генеральной совокупности принимаем.
Пример 2. Дан интервальный вариационный ряд (выборка задана интервально).
-
Интервалы
Частота
20
46
80
89
40
16
9
Гипотетическим является нормальное распределение.
При уровне значимости проверить, согласуется ли гипотеза о нормальном распределении генеральной случайной величины Х с выборкой.
Объем выборки
Нужно оценить параметры распределения. За выборочные данные возьмем середины интервалов.
-
-15
-5
5
15
25
35
45
20
46
80
89
40
16
9
Найдем оценку математического ожидания:
Оценка параметра а:
Вычислим несмещенную оценку дисперсии:
Оценка среднеквадратического отклонения:
Производится подсчет теоретических попаданий в каждый из интервалов. Используется выражение функции распределения нормального закона с параметрами через функцию Лапласа:
при
при
Считается, что параметры равны их оценкам:
Нормально распределенная случайная величина принимает любое значение на числовой оси. Поэтому при подсчете теоретических вероятностей изменяется первый и последний интервалы: первый интервал и последний
Находим теоретические вероятности:
Проведем проверку вычислений:
Занесем в таблицу эмпирические частоты, теоретические вероятности и теоретические частоты с объемом выборки
-
20
46
80
89
40
16
9
0,0688
0,1431
0,2682
0,2779
0,1686
0,0576
0,0158
20,64
42,93
80,46
83,37
50,58
17,28
4,74
В последнем интервале теоретическая частота меньше пяти:
Объединяем последний интервал с предпоследним: в множество попало членов выборки, теоретическая частота попадания генеральной случайной величины на равна:
Число интервалов после объединения
По формуле (6.3.1) найдем
По таблице 3 найдем критическую точку Подсчитаем число степеней свободы. После объединения осталось 6 интервалов; находились оценки двух параметров. При и числе степеней свободы определяем Критической областью является
Значение не превосходит Поэтому нет оснований отвергать гипотезу , то есть данные выборочные наблюдения согласуются с гипотезой о нормальном распределении генеральной случайной величины Х.
Пример 3. Дана выборка генеральной случайной величины Х:
-
3
5
7
9
11
13
15
17
19
21
21
16
15
25
23
14
21
22
18
25
Используя критерий при уровне значимости проверить гипотезу о том, что случайная величина Х равномерно распределена на множестве
Объем выборки:
По предположению множество всех значений генеральной случайной величины находится на отрезке Разобьем этот отрезок так, чтобы в каждом интервале находилось одно выборочное значение.
Выберем следующее разбиение:
Эмпирические частоты попадания в эти интервалы совпадают с
Найдем теоретические вероятности попадания в интервалы разбиения. Если случайная величина равномерно распределена на отрезке и выполняется условие то
Параметры распределения даны: Тогда:
Проведем проверку: Значение 1 не получено из-за округлений в вычислениях.
Занесем в таблицу эмпирические частоты теоретические вероятностии теоретические частоты:
-
i
1
2
3
4
5
6
7
8
9
10
21
16
15
25
23
14
21
22
18
25
0,038
0,099
0,099
0,099
0,099
0,099
0,099
0,099
0,099
0,168
7,6
19,8
19,8
19,8
19,8
19,8
19,8
19,8
19,8
33,6
Все теоретические частоты больше 5. Найдем наблюдаемое значение критерия :
Определяется критическая точка. В основной гипотезе все параметры известны, поэтому число оцененных параметров Всего 10 интервалов разбиения. Используем таблицу 3: прии числе степеней свободыкритическая точка:Критической областью является
Величина превышает Поэтому гипотеза о том, что случайная величинаХ распределена равномерно на не согласуется с выборочными данными.
Пример 3. Одновременно подбрасывается четыре монеты, случайная величина Х показывает число выпадений герба. Приведена выборка генеральной случайной величины Х:
-
0
1
2
3
4
10
20
43
22
5
Используя критерий с уровнем значимостипроверить гипотезу о том, что случайная величинаХ распределена по биномиальному закону.
Объем выборки:
Параметрами биномиального распределения являются N и р. Число подбрасываемых монет равно 4, поэтому Вероятность появления герба при подбрасывании одной монеты неизвестна, нужно оценить параметрр:
Множество выборочных значений совпадает со множеством значений случайной величиныХ. Разбиваем отрезок на интервалы так, чтобы в каждый интервал попало только одно выборочное значение:
Тогда:
Число интервалов
Используем формулу Бернулли:
Произведем вычисление вероятностей
Занесем в таблицу эмпирические частоты теоретические вероятностии теоретические частоты(объем выборки).
-
i
1
2
3
4
5
10
20
43
22
5
0,073
0,27
0,374
0,23
0,053
7,3
27
37,4
23
5,3
Все теоретические частоты больше 5.
Определим наблюдаемое значения критерия:
Находилась оценка только одного параметра, поэтому Число выборочных значений равно числу интервалов разбиения, поэтомуИспользуем таблицу 3: прии числе степеней свободыопределяем критическую точку
Наблюдаемое значение критерия не превышает критическое значение Поэтому нет оснований отвергать гипотезу о биномиальном распределении генеральной случайной величиныХ.