- •Российская академия народного хозяйства и государственной службы
- •Оглавление
- •Тема 1. Элементы комбинаторики
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 2. Случайные события §2.1. Классическое определение вероятности события
- •§2.2. Действия над событиями
- •§2.3. Теорема сложения вероятностей
- •§2.4. Понятие условной вероятности
- •§2.5. Теорема умножения вероятностей
- •§2.6. Формула полной вероятности и формула Байеса
- •§2.7. Повторение испытаний. Формула Бернулли
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 3. Случайные величины и их законы распределения §3.1. Общие определения
- •§3.2. Дискретные случайные величины и основные законы распределения
- •§3.3. Понятие интегральной и дифференциальной функции распределения
- •§3.4. Непрерывные случайные величины и основные законы распределения
- •§3.5. Действия над случайными величинами и основные числовые характеристики
- •§3.6. Неравенство Чебышева и интегральная теорема Муавра — Лапласа
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 4. Введение в математическую статистику §4.1 Основные определения
- •§4.2. Вариационный ряд и статистическое распределение выборки
- •§4.3. Графическое изображение статистического распределения
- •§ 4.4. Выборочные средние и методы их расчета
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 5. Статистические оценки параметров распределения §5.1 Точечные оценки
- •§ 5.2. Интервальные оценки
- •5.2.1. Доверительные интервалы для оценки параметров m и σ2 нормально распределенной генеральной совокупности
- •5.2.2. Доверительные интервалы для оценки разности средних двух нормально распределенных генеральных совокупностей
- •5.2.3. Доверительные интервалы для оценки доли признака
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 6. Статистические гипотезы § 6.1. Основные понятия статистической проверки гипотез
- •§ 6.2. Проверка гипотезы о равенстве дисперсии нормально распределенной генеральной совокупности некоторому значению
- •§ 6.3. Проверка гипотезы о равенстве генеральной средней нормально распределенной генеральной совокупности некоторому значению
- •§ 6.4. Проверка гипотезы о доле признака
- •§ 6.5. Проверка гипотезы о виде распределения генеральной совокупности
- •§ 6.6. Проверка гипотезы о равенстве параметров двух нормально распределенных генеральных совокупностей
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Приложение
- •Значения функции плотности стандартизированного нормального распределения n (0, 1)
- •Значения функции распределения f (0,1)(X) нормального закона n (0,1);
- •Распределение Пуассона
- •Квантили tp распределения Стьюдента
- •Квантили распределения 2(хи-квадрат)
- •Квантили распределения Фишера f0,99(k1, k2)
- •Квантили распределения Фишера f0,975(k1, k2).
- •Квантили распределения Фишера f0,95(k1, k2)
- •Квантили распределения Фишера f0,90(k1, k2)
- •Заключение
- •Евгений Алексеевич Рапоцевич теория вероятностей и мамематическая статистика Учебное пособие
- •630102, Г. Новосибирск, ул. Нижегородская, 6, СибАгс
§ 6.4. Проверка гипотезы о доле признака
Пусть х — наблюдаемое значение случайной величины Х, имеющей биномиальное распределение B (п; Р); р* − относительная частота : оценка параметра Р, вычисляемая по формуле
Если п 50, а выборочное значение р* удовлетворяет условиям пр* 5 и п р* 5, то для проверки гипотезы Н0: Р = р0 используют статистику
При условии, что гипотеза Н0 верна, статистика критерия Z имеет распределение, близкое к стандартному нормальному распределению: .
Критическая область критерия при уровне значимости определяется неравенствами
z* > z1- − при альтернативной гипотезе Н1: Р р0,
z* z − при альтернативной гипотезе Н1: Р р0,
z* − при альтернативной гипотезе Н1: Рр0.
Для проверки гипотезы Н0: Р = р0 можно использовать доверительные интервалы для параметра Р.
При этом гипотеза Н0 не отвергается (принимается) на уровне значимости , если соответствующий односторонний или двусторонний доверительный интервал накрывает значение р0; в противном случае гипотеза Н0 отклоняется.
Пример.
В партии из 700 изделий обнаружили 50 бракованных. Проверить гипотезу, что доля брака составляет 6% на 5% уровне значимости против альтернативной гипотезы, что брак больше 6%.
Имеем Н0: Р = 0,06
Н1: Р > 0.06
Вычислим р*=50/700=0,0714; α= 0,05, поэтому1-α=0,95. По таблице 2 найдемz0,95квантиль порядка 0,95 стандартного нормального распределения:z0,95=1,645. Подставим в формулу
Получается, что 1,27<1,645 и мы попали в область принятия решения и верна гипотеза Н0. В итоге нет отличия доли брака от 6% на 5% уровне.
§ 6.5. Проверка гипотезы о виде распределения генеральной совокупности
Пусть — выборка наблюдаемых значений случайной величины Х. Проверяется гипотеза Н0, утверждающая, что случайная величина Х имеет закон распределения . Процедура применения критерия (хи-квадрат) для проверки гипотезы Н0 состоит из следующих этапов.
Этап 1. По выборке наблюдаемых значений случайной величины Х находятся оценки неизвестных параметров предполагаемого закона распределения .
Этап 2. Если Х — дискретная случайная величина, то определяются частоты пi, i = 1, 2, , k, с которыми каждое значение или группа значений встречается в выборке. Если Х — непрерывная случайная величина, то область ее значений разбивается на k непересекающихся интервалов 1, 2, , k, и определяется число элементов выборки пi, i = 1, 2, , k, принадлежащих каждому интервалу. Очевидно, что в обоих случаях .
Этап 3. В случае, если Х — дискретная случайная величина, используя предполагаемый закон распределения , вычисляются вероятности pi, i = 1, 2, , k, с которыми случайная величина Х принимает каждое значение, или вероятность появления группы значений. В случае, если Х — непрерывная случайная величина, вычисляется вероятность pi попадания в каждый интервал i
P (Xi) = pi, i = 1, 2, , k.
Очевидно, что в обоих случаях .
Этап 4. Вычисляется выборочное значение статистики критерия
Этап 5. Принимается статистическое решение: гипотеза Н0 не противоречит выборке наблюдений на заданном уровне значимости , если где l — число параметров распределения , которые оцениваются по выборке; если же то гипотеза Н0 отклоняется.
Замечание. Использование критерия (хи-квадрат) основано на том факте, что случайная величина
имеет распределение, близкое к стандартному нормальному распределению . Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов выполнялось условие npi 5. Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними интервалами.
Примеры:
Руководство фирмы, владеющей тремя магазинами, решило выяснить, посещают ли покупатели все три магазина одинаково охотно, либо имеется некоторое различие. Для проверки была собрана информация о количестве покупателей, сделавших покупки в течение недели. Оказалось, что в первом магазине это число составляет 160 человек, во втором – 225, в третьем – 215.
Здесь нулевой гипотезой будет равенство вероятностей посещения покупателем первого р1, второго р2 и третьего р3 магазинов:Н0: р1= р2= р3=1/3. В результате испытания получаемm1=160,m2=225,m3=215,n=160+225+215=600. Вычислим величинуОбратимся теперь к таблице критических значений при степени свободы равной 2. Даже на уровне значимости=0,01 имеемТаким образом,Поэтому, разницу в посещаемости магазинов в течение недели нельзя объяснить случайными колебаниями, то есть нулевая гипотеза отвергается.
Имеется следующая выборка из 50 вариант:
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
8 |
ni |
6 |
18 |
11 |
7 |
4 |
1 |
2 |
1 |
Проверим гипотезу о соответствии выборочных данных распределению Пуассона с параметром 2 с помощью критерия (хи-квадрат) на уровне значимости = 0,05.
Распределение Пуассона в общем случае имеет вид
По статистической таблице 3 для параметра 2 , находим теоретические вероятности:
Для нахождения ожидаемых (теоретических) частот появления исследуемого признака найденные вероятности нужно умножить на объем выборки и округлить до ближайшего целого. Для исследуемой выборки найденные вероятности нужно умножить на 50.
Для обеспечения необходимой точности нужно, чтобы частота каждой группы была не менее пяти, поэтому значения для к = 4, 5, 6 и 8 нужно объединить. Результаты запишем в виде таблицы, в первой строке которой выписаны наблюдаемые значения, объединенные в группы, во второй — наблюдаемые значения (сколько раз значение наблюдаемого признака приняло данное значение). В третьей строке запишем соответствующие теоретические вероятности, а в четвертой — теоретические значения частот:
xi |
0 |
1 |
2 |
3 |
4 |
ni |
6 |
18 |
11 |
7 |
8 |
pi |
0,135 |
0,270 |
0,270 |
0,180 |
0,145 |
npi |
7 |
14 |
14 |
9 |
7 |
Вычисляем выборочное значение статистики (хи-квадрат):
Параметр задавался, а не вычислялся по выборке, данные были сгруппированы в пять групп, поэтому число степеней свободы равно = 5 = 4. По таблице квантилей распределения (хи-квадрат) находим критическую точку
Поскольку 2,52 < 9,49, то выполняется неравенство т. е. значение статистики критерия, вычисленное по выборочным данным, меньше критического значения. Следовательно, мы считаем, что наблюдаемые значения не противоречат гипотезе о том, что исследуемый признак Х имеет распределение Пуассона с параметром 2.
Задания для самостоятельного решения:
.Трое рабочих работают на трех одинаковых станках. В конце смены первый рабочий изготовил 60 деталей, второй – 80, третий – 100 деталей. Можно ли на уровне значимости=0,01 принять гипотезу о том, что производительности труда первых двух рабочих равны между собой и в два раза меньше производительности третьего рабочего?
Наблюдение за 1000 автомобилями на скоростной дороге с четырьмя полосами движения показало, что первую полосу предпочли 294 водителя, вторую – 276 водителей, третью −238 водителей, а остальные выбрали четвертую. Можно ли на основании этих данных утверждать, что равное количество водителей выбирает каждую из полос?