Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

теория вероятностей

.pdf
Скачиваний:
196
Добавлен:
11.05.2015
Размер:
3.26 Mб
Скачать

71

хронометрические измерения времени её выполнения у 36 работниц, занятых на этой операции, и получено среднее время выполнения операции x = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости α = 0.01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если известно, что среднее квадратическое отклонение генеральной совокупности σ = 3.5 с?

Решение. Сформулируем основную и альтернативную гипотезы.

H0 : a = 40 — неизвестное генеральное среднее равно заданному значению (время выполнения технологической операции соответствует норме).

H1 : a > 40 — время выполнения технологической операции больше ус-

тановленной нормы.

По условию задачи уровень значимости α = 0.01, т.е. событие, которое происходит с такой вероятностью, считаем практически невозможным.

Так как выборка большого объема (n = 36 > 30) и среднее квадратиче-

ское отклонение генеральной совокупности известно, воспользуемся статистикой K ~ N (0.1) (табл. 6.2). Её наблюдаемое значение равно

Kнабл = x a0

n =

42 40

36 = 3.43.

σ

 

3.5

 

Так как альтернативная гипотеза правосторонняя, то и критическая область — правосторонняя (рис. 6.1, а) и её границу Kкр следует искать по

таблице функции Лапласа (приложение 1) из равенства Φ(Kкр) = 12 −α. Так как α = 0.01 имеем Φ(Kкр) = 0.5 0.01 = 0.49 и значение Kкр = 2.33.

Наблюдаемое значение Kнабл > Kкр, т.е. попадает в критическую об-

ласть, следовательно, на данном уровне значимости нулевая гипотеза отвергается в пользу альтернативной. Уровень значимости характеризует надежность нашего утверждения: более чем с 99 % надежностью можно утверждать, что среднее время выполнения этой операции превышает норму. Следовательно, жалобы работниц обоснованы.

Заметим, что при левосторонней конкурирующей гипотезе H1 : a < 40 граница критической области отрицательна (рис. 6.1, б). При двусторонней конкурирующей гипотезе H1 : a 40 (рис. 6.1, в) правую границу критической области Kкр находят по таблицам функции Лапласа (приложение 1) из

равенства Φ(Kкр) = 1 2α.

К гипотезе о значении генеральной дисперсии мы приходим, если требуется проверить предположение о точности настройки станка или устройства.

72

Для проверки основной гипотезы H0 : σ2 = σ0 используется статистика, имеющая распределение «хи-квадрат» (табл. 6.3). Альтернативная гипотеза обычно выбирается правосторонней H1 : σ2 > σ02.

Пример 2. Точность работы станка-автомата проверяется по дисперсии

контролируемого размера деталей, которая не должна превышать σ2 = 0.1. По выборке из 25 случайно отобранных деталей рассчитаны оценки генераль-

ного среднего и генеральной дисперсии, при этом

s2 = 0.2. На уровне значи-

мости 0.05 проверить, обеспечивает ли станок требуемую точность.

 

 

 

Гипотеза о генеральной дисперсии

Таблица 6.3

 

 

 

 

 

 

 

 

 

 

 

 

Гипотеза

 

H1 : σ2 > σ02.

 

 

 

Предположения

Нормальная генеральная

 

Нормальная генеральная

 

совокупность с известным

 

совокупность с неизвест-

 

параметром a

 

ным параметром a

Оценки

 

 

 

 

 

 

 

по выборке

σ2 = s2

 

a = x; σ2 = s2

Статистика K

nS

2

 

 

(n 1)S

2

 

 

 

 

 

 

 

 

σ02

 

 

 

σ02

 

 

Распределение

«хи-квадрат»

 

«хи-квадрат»

статистики K

χ2(n)

 

χ 2

( n 1 )

Решение. Основная гипотеза H0 : σ2 = 0.1 — станок обеспечивает тре-

буемую точность. Альтернативная гипотеза правосторонняя

H0 : σ2 > 0.1

точность не обеспечивается. Объем выборки

n = 25, уровень значимости

α = 0.05. Так как генеральное среднее неизвестно (оценивается по выборке),

то будем использовать статистику K = (n 1)S 2 ~ χ2(n1). Её наблюдаемое

σ02

значение равно Kнабл = (25 1) 0.2 = 48.

0.1

Критическая область является правосторонней и ее границу Kкр определяем по таблице распределения «хи-квадрат» (приложение 2):

Kкр = χ2 (n 1; α) = χ2 (24; 0.05) = 36.4.

73

Наблюдаемое значение попадает в критическую область: Kнабл > Kкр,

поэтому основная гипотеза H0 отвергается: станок не обеспечивает требуемой точности и требует наладки.

6.2.2. Сравнение параметров нормальной генеральной совокупности

На практике часто бывает необходимо сравнить два способа действия по их результатам. Например: обеспечивают ля два станка одинаковую точность обработки деталей? Или одинакова ли в среднем производительность труда при двух технологиях работы? Нередко на этот вопрос можно ответить, сравнивая выборочные средние или выборочные дисперсии.

 

Пусть по

двум независимым

выборкам

x1, x2

, ..., xn

и

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

y1, y2 , ..., yn2 , извлеченным из нормальных

генеральных совокупностей

X ~ N (a1, σ1) и

Y ~ N (a2 , σ2 )

найдены несмещенные оценки дисперсий

σ2 и

σ2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

1

 

n

 

 

 

 

s12 =

( xi x )2 и s22 =

 

 

 

2 ( y j y )2 .

 

 

 

 

 

 

 

 

 

 

 

 

n1 1 i=1

 

 

 

 

n2 1 j =1

 

 

 

Для того, чтобы на данном уровне значимости

α проверить гипотезу о

равенстве генеральных

дисперсий

H

0

: σ2

= σ2 ,

используют

статистику

 

 

 

 

 

 

1

 

2

 

 

 

(табл. 6.4), имеющую распределение Фишера с числами степеней свободы k1 = n1 1 и k2 = n2 1. Наблюдаемое значение этой статистики обычно

вычисляют, рассматривая отношение большей оценки max(s12 , s22 ) к мень-

шей min(s12 , s22 ), поэтому альтернативная гипотеза и критическая область

являются правосторонними.

Таблица 6.4

Сравнение генеральных дисперсий

Гипотеза

H

0

: σ2

 

= σ2

 

 

1

 

 

 

2

Предположения

Нормальная генеральная

 

совокупность

Оценки

 

 

 

 

 

 

 

по выборкам

σ12 = s12;

σ22 = s22

Статистика K

 

 

2

 

 

 

 

 

 

 

 

S1

 

 

 

 

 

 

 

 

S22

 

 

 

 

Распределение

Распределение Фишера

статистики K

F(n 1, n

2

1)

 

 

 

1

 

 

 

 

74

Пример 3. Двумя методами проведены измерения одной и той же физической величины. В первом случае по выборке объема n1 = 5 получена не-

смещенная оценка дисперсии s12 =14.8. Для второго метода соответственно

n2 = 6 и s22 =10.2. Можно ли считать, что оба метода обеспечивают одина-

ковую точность измерений, если принять уровень значимости α = 0.05? Предполагается, что результаты измерений распределены нормально и выборки независимы.

Решение. Будем судить о точности методов по величинам генеральных

дисперсий. Нулевая гипотеза имеет вид

H

0

: σ2

= σ2

. Наблюдаемое значе-

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

s2

 

14.8

 

 

ние статистики K (табл. 6.4) равно

Kнабл

=

 

 

1

=

 

 

=1.45.

 

 

s22

10.2

 

 

 

 

 

 

 

 

 

 

Границу правосторонней критической области

Kкр определим по таб-

лицам распределения

Фишера

(приложение

4)

на

уровне значимости

α = 0.05 и

вычисленным по

выборке

 

числам

степеней

свободы

k1 = n1 1 = 5 1 = 4, k2 = n2 1 = 6 1 = 5 :

 

 

 

 

 

 

Kкр = F (k1, k2; α) = F (4, 5; 0.05) = 5.19.

 

Наблюдаемое

значение

статистики K не

попадает

в

критическую

область

(Kнабл < Kкр), поэтому нет оснований отвергать нулевую гипотезу. Выбо-

рочные оценки дисперсий различаются незначимо, и оба метода обеспечивают одинаковую точность измерений.

Пусть теперь по двум независимым выборкам объема n1 и n2 , извле-

ченным из нормальных генеральных совокупностей

X ~ N (a1, σ1) и

Y ~ N (a2 , σ2 )

требуется сравнить генеральные средние, т.е. основная гипо-

теза имеет вид

H0 : a1 = a2 (H0 :

 

 

 

 

 

X

=Y

).

 

Если обе генеральные дисперсии известны, то используется статистика, имеющая стандартное нормальное распределение. Если же дисперсии неизвестны, но предполагается, что они равны, то применяется статистика, имеющая распределение Стьюдента (табл. 6.5).

Пример 4. Экономический анализ производительности труда предприятий отрасли позволил выдвинуть гипотезу о наличии двух типов предприятий с различной средней величиной показателя производительности труда. Выборочное обследование 42 предприятий первой группы дало следующие результаты: средняя производительность труда x =119 деталей. На 35 обследован-

ных предприятиях второй группы средняя производительность труда y =107

деталей. Генеральные дисперсии известны: σ12 ( X ) =126.9 (дет.2 ),

75

σ22 (Y ) =136.1(дет.2 ). Считая, что выборки извлечены из нормально распре-

деленных генеральных совокупностей X и Y, на уровне значимости 0.05 проверить, случайно ли полученное различие средних показателей производительности труда в группах или же имеются два типа предприятий с различной средней величиной производительности труда.

Решение. Сформулируем основную и альтернативную гипотезы.

H0 : a1 = a2 или H0 : X =Y — генеральные средние двух нормально

распределенных совокупностей равны (предприятия двух обследованных групп относятся к одному типу предприятий; выборочные средние различаются незначимо; средняя производительность труда в двух группах одинакова).

Таблица 6.5

Сравнение генеральных средних

Гипотеза

 

 

 

 

 

 

H0 : a1 = a2

 

 

 

 

 

Предположения

Нормальные генеральные

Нормальные генеральные

 

совокупности;

 

совокупности;

 

σ1, σ2 известны

σ1, σ2 неизвестны;

σ1 = σ2

Оценки

 

 

 

 

 

 

 

 

по выборке

a1 = x;

a2

= y

 

a1 = x; a2 = y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

= s2;

σ2 = s2

 

 

 

 

 

 

 

 

1

1

 

2

2

 

 

 

 

 

 

 

 

 

s2

(n1 1)s12 +(n2 1)s22

 

 

 

 

 

 

 

 

 

 

 

n1 + n2 2

 

Статистика K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

X Y

n1 n2

 

σ2

 

σ2

 

 

+

 

 

S

n1 + n2

 

1

 

n

2

 

 

 

 

 

 

 

 

n

 

2

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

Распределение

Стандартное нормальное

Распределение Стьюдента

статистики K

N (0,1)

 

 

 

T(n +n

2

2)

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

H1 : a1 a2 — генеральные средние различны (предприятия двух групп

относятся к разному типу предприятий; средняя производительность труда в двух группах неодинакова).

Так как генеральные дисперсии известны, то для проверки гипотезы применим статистику, имеющую стандартное нормальное распределение (табл. 6.5). Её наблюдаемое значение равно

 

 

76

 

 

 

 

 

Kнабл = x y

= 119 107 = 4.56.

σ12

σ22

126.9

+

136.1

 

 

 

 

 

n1

+ n2

42

35

 

Альтернативная гипотеза H1 двусторонняя, поэтому критическое значение Kкр находим по таблице значений функции Лапласа (приложение 1) из

соотношения: Φ(Kкр) = 1 2α.

По условию α = 0.05. Отсюда Φ(Kкр) = 0.475, следовательно Kкр =1.96.

Так как критическая область двусторонняя, то ее границами служат две точки: Kкр =1.96 и Kкр = −1.96, т.е. область допустимых значений гипо-

тезы H0 представляет собой интервал (1.96; 1.96). Наблюдаемое значение Kнабл = 4.56 лежит за пределами этого интервала и не является допустимым на заданном уровне значимости. На данном уровне значимости основная гипотеза H0 отвергается в пользу альтернативной: полученное различие

средних показателей труда в группах неслучайно, имеется два типа предприятий с различной средней производительностью труда.

Пример 5. Предполагается, что применение нового типа резца сократит время обработки некоторой детали. Хронометраж времени обработки 9 деталей, обработанных старым типом резцов, дал следующие результаты: среднее выборочное время обработки детали x = 57 мин, несмещенная оценка дис-

персии s2X =186.2(мин2 ). Среднее время обработки 15 деталей, изготовленных с помощью нового резца, y = 52 мин, несмещенная оценка дисперсии

sY2 =166.4(мин2 ). На уровне значимости α = 0.01 выяснить, позволяет ли использование нового типа резцов сократить время обработки деталей.

Решение. Сформулируем основную и альтернативную гипотезы.

H0 : X =Y (H0 : a1 = a2 ) — генеральные средние двух нормально рас-

пределенных совокупностей с неизвестными дисперсиями равны. Применительно к условию это означает, что среднее время, затрачиваемое на обработку детали резцами нового и старого типа одинаково, т.е. использование нового резца не позволяет снизить время на обработку детали.

H1 : X >Y — среднее время, затрачиваемое на обработку детали

резцами старого типа, больше, чем — нового, т.е. использование нового типа резца позволяет снизить время на обработку детали. Альтернативная гипотеза правосторонняя, значит критическая область правосторонняя.

77

Так как генеральные дисперсии неизвестны, то применим статистику, имеющую распределение Стьюдента (табл. 6.5). Но предварительно проверим, выполняется ли предположение о том, что неизвестные генеральные дисперсии равны. Это предположение проверяется с помощью вспомогательной ну-

левой гипотезы H0: σ2X = σY2 с альтернативой H1: σ2X > σY2 (выбрана

альтернатива — неравенство, т.к. выборочная дисперсия для Х значительно больше выборочной дисперсии для Y).

В качестве критерия для сравнения двух дисперсий применим статистику, имеющую распределение Фишера (табл. 6.4) Её наблюдаемое значение равно

Kнабл =

s2X

= 186.2

=1.12.

sY2

 

166.4

 

Критическое значение Kкр определим по таблице распределения Фи-

шера (приложение 4) по уровню значимости

α = 0.01 и числам степеней

свободы k1 = n1 1 = 9 1 =8, k2 = n2 1 =15 1 =14 :

Kкр = F(k1, k2 ; α) = F(8, 14; 0.01) = 4.14.

Наблюдаемое значение не попадает в правостороннюю критическую область (Kнабл < Kкр), поэтому нет оснований отвергать нулевую гипотезу

H0о равенстве генеральных дисперсий.

Вернемся теперь к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей с неизвестными (но одинаковыми) генеральными дисперсиями. Оценим эту неизвестную генеральную дисперсию по совокупности двух выборок:

s2

(n1 1)s2X +(n2 1)sY2

=

(9 1) 186.2 +(15 1) 166.4

=190.53.

n1 + n2 2

9 +15 2

 

 

 

Наблюдаемое значение статистики K (табл. 6.5) равно

 

Kнабл

= x y

 

n1n2

= 57 52

9 15

= 0.86.

 

s

 

n1 + n2

190.53

9 +15

 

Критическое значение

Kкр этой статистики находим по таблице рас-

пределения Стьюдента (приложение 3) при уровне значимости α = 0.01 и числе степеней свободы k1 = n1 + n2 2 = 22 (односторонняя критическая область): Kкр = t(k; α) = t(22; 0.01) = 2.51.

Наблюдаемое значение не попадает в правостороннюю критическую область (Kнабл < Kкр), поэтому нет оснований отклонять основную гипотезу

H0. На уровне значимости 0.01 нельзя утверждать, что использование нового типа резцов позволило сократить время обработки детали.

78

Заметим, что при левосторонней альтернативной гипотезе H1 : X <Y значение Kкр следует находить по таблице распределения Стьюдента (прил.

3) для уровня значимости α и числа степеней свободы k1 = n1 + n2 2 (односторонняя критическая область) и присваивать ему знак «минус».

При двусторонней конкурирующей гипотезе H1 : X Y значение Kкр

находим по таблицам распределения Стьюдента (приложение 3) с уровнем значимости α и числом степеней свободы k1 = n1 + n2 2 для двусторонней критической области. Область допустимых значений представляет собой интервал (Kкр; Kкр).

6.2.3. Задачи о генеральной доле

В разделе 5.2. мы рассматривали задачу построения доверительного интервала для генеральной доли p события А. На вопрос «Накрывает ли доверительный интервал заданное значение p0 ?» — можно ответить, проверив ста-

тистическую гипотезу H0 : p = p0. При этом предполагается, что опыты

проводятся по схеме испытаний Бернулли (независимы, вероятность p появления события А постоянна). По выборке объема n определяют относительную

частоту p появления события A : p = mn , где m — количество появлений

события А в серии из n испытаний. Для проверки гипотезы H0 используется

статистика, имеющая при достаточно большом объеме выборки стандартное нормальное распределение (табл. 6.6).

Таблица 6.6

Гипотезы о генеральной доле

Гипотеза

H0 : p = p0

 

H0 : p1 = p2

Предположения

Схема испытаний

Схема испытаний

 

Бернулли

 

 

Бернулли

 

Оценки

p

 

=

m

 

=

m

 

m

по выборке

 

n

p1

1 ;

p2 =

2 ;

 

 

 

 

 

 

n1

 

n2

~ = m1 + m2 p

n1 + n2

Статистика K

p

 

p0 n

 

 

 

n1n2

 

 

p1

p2

 

p0 (1 p0 )

~

~

 

n1 + n2

 

p(1 p)

 

Распределение

Стандартное нормальное

Стандартное нормальное

статистики K

 

 

N (0,1)

 

N (0,1)

 

79

Пример 6. Партия изделий принимается, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α = 0.02 принять партию?

Решение. Сформулируем основную и альтернативную гипотезы.

H0 : p = p0 = 0.97 — неизвестная генеральная доля p равна заданному значению p0 = 0.97. Применительно к условию — вероятность того, что де-

таль из проверяемой партии окажется соответствующей стандарту, равна 0.97; т.е. партию изделий можно принять.

H1 : p < 0.97 — вероятность того, что деталь из проверяемой партии

окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.

Наблюдаемое значение статистики K (табл. 6.6) вычислим при заданных

значениях p0 = 0.97, n = 200, m =193 :

 

 

p p

 

 

193

0.97

 

 

 

 

200

 

 

Kнабл =

0

n =

 

= −0.415.

 

 

p0 (1 p0 )

 

0.97(1 0.97)

 

 

Критическое значение находим по таблице функции Лапласа (приложе-

ние 1) из равенства

 

 

1 −α.

 

 

 

 

Φ(Kкр) =

 

 

 

 

 

 

2

 

 

 

 

 

По условию α = 0.02, отсюда

Φ(Kкр) = 0.48 и Kкр = 2.05. Критиче-

ская

область

левосторонняя,

 

т.е.

является

интервалом

(−∞; Kкр) = (−∞;2.05). Наблюдаемое значение

Kнабл = −0.475 не при-

надлежит критической области, следовательно, на данном уровне значимости нет оснований отклонять основную гипотезу. Партию изделий принять можно.

Пример 7. Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бракованных, среди 300 изделий второго завода — 15 бракованных.

На уровне значимости 0.025 выяснить, имеется ли существенное различие в качестве изготавливаемых этими заводами деталей.

Решение. Это задача о сравнении генеральных долей двух совокупностей. Сформулируем основную и альтернативную гипотезы.

H0 : p1 = p2 — генеральные доли равны. Применительно к условию —

вероятность появления бракованного изделия в продукции первого завода

80

равна вероятности появления бракованного изделия в продукции второго завода (качество продукции одинаково).

H1 : p1 p2 — заводы изготавливают детали разного качества.

Для вычисления наблюдаемого значения статистики K (табл. 6.6) рассчитаем оценки по выборке.

p = m1

=

20

= 0.1;

p = m2

=

15

= 0.05;

 

 

1

n1

 

200

 

2

n2

300

 

 

 

 

 

 

 

 

 

 

~

 

m1

+ m2

 

20 +15

 

35

 

 

 

 

 

 

 

p

=

 

 

=

 

=

 

= 0.07.

 

 

 

 

 

n + n

 

200 +300

500

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

Наблюдаемое значение равно

 

 

 

 

 

 

 

K

 

=

p p

 

 

n n

2

 

=

0.1

0.05

=

200 300

= 2.15.

набл

1

2

 

1

 

 

 

 

 

 

 

 

~

~

 

m1 + m2

 

0.07(1 0.07)

200 +300

 

 

 

 

p(1

p)

 

 

Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K ~ N (0,1) находим по таблице функции Лапласа (приложе-

ние 1) из равенства

Φ(Kкр) =

1 −α

.

 

 

2

Φ(Kкр) = 0.4875 и Kкр = 2.24. При

 

 

 

По условию

α = 0.025, отсюда

двусторонней альтернативе

область

допустимых

значений имеет вид

(−∞; Kкр) = (2.24; 2.24). Наблюдаемое значение

Kнабл = 2.15 попадает

в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества.

6.3.Проверка гипотез о виде распределения. Критерий согласия Пирсона

Выше мы решали задачи, в которых распределение генеральной совокупности предполагалось известным. Предположение о виде закона распределения можно сделать по гистограмме или полигону. Но затем это предположение следует проверить. Для проверки гипотез о виде распределения служат специальные критерии — критерии согласия. Они отвечают на вопрос: согласуются ли результаты экспериментов с предположением о том, что генеральная совокупность имеет заданное распределение.

Например, по гистограмме для примера 2 подраздела 3.2 (рис. 3.2) можно сделать предположение о том, что генеральная совокупность распределена по нормальному закону. Проверим это предположение с помощью критерия согласия Пирсона. В этом критерии мерой расхождения между гипотетическим (предполагаемым) и эмпирическим распределением служит статистика

k

(n

j

np

j

)2

 

K =

 

 

 

 

,

 

 

 

np j

 

 

j =1