Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Матан 2 семестр / Теория вероятностей и МС.doc
Скачиваний:
459
Добавлен:
17.03.2016
Размер:
4.16 Mб
Скачать

§ 6.4. Проверка гипотезы о доле признака

Пусть х — наблюдаемое значение случайной величины Х, имеющей биномиальное распределение B (п; Р); р* − относительная частота : оценка параметра Р, вычисляемая по формуле

Если п  50, а выборочное значение р* удовлетворяет условиям пр*  5 и п р*  5, то для проверки гипотезы Н0: Р = р0 используют статистику

При условии, что гипотеза Нверна, статистика критерия Z имеет распределение, близкое к стандартному нормальному распределению: .

Критическая область критерия при уровне значимости определяется неравенствами

  1. z* > z1- − при альтернативной гипотезе Н1: Р р0,

  2. z* z − при альтернативной гипотезе Н1: Р р0,

  3. z*  − при альтернативной гипотезе Н1: Рр0.

Для проверки гипотезы Н0: Р = рможно использовать доверительные интервалы для параметра Р.

При этом гипотеза Нне отвергается (принимается) на уровне значимости , если соответствующий односторонний или двусторонний доверительный интервал накрывает значение р0; в противном случае гипотеза Нотклоняется.

Пример.

В партии из 700 изделий обнаружили 50 бракованных. Проверить гипотезу, что доля брака составляет 6% на 5% уровне значимости против альтернативной гипотезы, что брак больше 6%.

Имеем Н0: Р = 0,06

Н1: Р > 0.06

Вычислим р*=50/700=0,0714; α= 0,05, поэтому1-α=0,95. По таблице 2 найдемz0,95квантиль порядка 0,95 стандартного нормального распределения:z0,95=1,645. Подставим в формулу

Получается, что 1,27<1,645 и мы попали в область принятия решения и верна гипотеза Н0. В итоге нет отличия доли брака от 6% на 5% уровне.

§ 6.5. Проверка гипотезы о виде распределения генеральной совокупности

Пусть — выборка наблюдаемых значений случайной величины Х. Проверяется гипотеза Н0, утверждающая, что случайная величина Х  имеет закон распределения . Процедура применения критерия (хи-квадрат) для проверки гипотезы Нсостоит из следующих этапов.

Этап 1. По выборке наблюдаемых значений случайной величины Х находятся оценки неизвестных параметров предполагаемого закона распределения .

Этап 2. Если Х — дискретная случайная величина, то определяются частоты пi, i = 1, 2, , k, с которыми каждое значение или группа значений встречается в выборке. Если Х — непрерывная случайная величина, то область ее значений разбивается на k непересекающихся интервалов 1, 2, , k, и определяется число элементов выборки пi, i = 1, 2, , k, принадлежащих каждому интервалу. Очевидно, что в обоих случаях .

Этап 3. В случае, если Х — дискретная случайная величина, используя предполагаемый закон распределения , вычисляются вероятности pi, i = 1, 2, , k, с которыми случайная величина Х принимает каждое значение, или вероятность появления группы значений. В случае, если Х — непрерывная случайная величина, вычисляется вероятность pi попадания в каждый интервал i

P (Xi) = pi, i = 1, 2, , k.

Очевидно, что в обоих случаях .

Этап 4. Вычисляется выборочное значение статистики критерия

Этап 5. Принимается статистическое решение: гипотеза Нне противоречит выборке наблюдений на заданном уровне значимости , если где l — число параметров распределения , которые оцениваются по выборке; если же то гипотеза Нотклоняется.

Замечание. Использование критерия (хи-квадрат) основано на том факте, что случайная величина

имеет распределение, близкое к стандартному нормальному распределению . Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов выполнялось условие npi  5. Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними интервалами.

Примеры:

  1. Руководство фирмы, владеющей тремя магазинами, решило выяснить, посещают ли покупатели все три магазина одинаково охотно, либо имеется некоторое различие. Для проверки была собрана информация о количестве покупателей, сделавших покупки в течение недели. Оказалось, что в первом магазине это число составляет 160 человек, во втором – 225, в третьем – 215.

Здесь нулевой гипотезой будет равенство вероятностей посещения покупателем первого р1, второго р2 и третьего р3 магазинов:Н0: р1= р2= р3=1/3. В результате испытания получаемm1=160,m2=225,m3=215,n=160+225+215=600. Вычислим величинуОбратимся теперь к таблице критических значений при степени свободы равной 2. Даже на уровне значимости=0,01 имеемТаким образом,Поэтому, разницу в посещаемости магазинов в течение недели нельзя объяснить случайными колебаниями, то есть нулевая гипотеза отвергается.

  1. Имеется следующая выборка из 50 вариант:

xi

0

1

2

3

4

5

6

8

ni

6

18

11

7

4

1

2

1

Проверим гипотезу о соответствии выборочных данных распределению Пуассона с параметром 2 с помощью критерия (хи-квадрат) на уровне значимости  = 0,05.

Распределение Пуассона в общем случае имеет вид

По статистической таблице 3 для параметра 2 , находим теоретические вероятности:

Для нахождения ожидаемых (теоретических) частот появления исследуемого признака найденные вероятности нужно умножить на объем выборки и округлить до ближайшего целого. Для исследуемой выборки найденные вероятности нужно умножить на 50.

Для обеспечения необходимой точности нужно, чтобы частота каждой группы была не менее пяти, поэтому значения для к = 4, 5, 6 и 8 нужно объединить. Результаты запишем в виде таблицы, в первой строке которой выписаны наблюдаемые значения, объединенные в группы, во второй — наблюдаемые значения (сколько раз значение наблюдаемого признака приняло данное значение). В третьей строке запишем соответствующие теоретические вероятности, а в четвертой — теоретические значения частот:

xi

0

1

2

3

4

ni

6

18

11

7

8

pi

0,135

0,270

0,270

0,180

0,145

npi

7

14

14

9

7

Вычисляем выборочное значение статистики (хи-квадрат):

Параметр  задавался, а не вычислялся по выборке, данные были сгруппированы в пять групп, поэтому число степеней свободы равно  = 5 = 4. По таблице квантилей распределения (хи-квадрат) находим критическую точку

Поскольку 2,52 < 9,49, то выполняется неравенство т. е. значение статистики критерия, вычисленное по выборочным данным, меньше критического значения. Следовательно, мы считаем, что наблюдаемые значения не противоречат гипотезе о том, что исследуемый признак Х имеет распределение Пуассона с параметром   2.

Задания для самостоятельного решения:

  1. .Трое рабочих работают на трех одинаковых станках. В конце смены первый рабочий изготовил 60 деталей, второй – 80, третий – 100 деталей. Можно ли на уровне значимости=0,01 принять гипотезу о том, что производительности труда первых двух рабочих равны между собой и в два раза меньше производительности третьего рабочего?

  2. Наблюдение за 1000 автомобилями на скоростной дороге с четырьмя полосами движения показало, что первую полосу предпочли 294 водителя, вторую – 276 водителей, третью −238 водителей, а остальные выбрали четвертую. Можно ли на основании этих данных утверждать, что равное количество водителей выбирает каждую из полос?

Соседние файлы в папке Матан 2 семестр