Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_теория.doc
Скачиваний:
23
Добавлен:
17.09.2019
Размер:
3.64 Mб
Скачать

14.3. Проверка гипотезы о принадлежности выделяющих единиц исследуемой генеральной совокупности

Как отмечалось в предыдущих лекциях неоднократного, изучение массовых явлений, как правило, осуществляется по неполной информации. В составе собранных данных могут встречаться единичные наблюдения, у которых отдельные значения изучаемых признаков заметно отличаются от общей тенденции изменения большинства значений. Причины таких отличий могут быть разными:

  1. из-за ошибок наблюдения;

  2. вследствие случайного стечения различных обстоятельств, каждый из которых в отдельности несущественный, но совокупное их влияние привело к таким резко выделяющимся от общей картины значениям признаков;

  3. как следствие нарушения однородности изучаемой совокупности.

В общем случае все значения изучаемых признаков фиксируются по известным единицам совокупности по их части, отобранной с учетом всех требований. Следовательно, первичные статистические данные, включая и резко «выделяющемся», соответствуют конкретным случаям проявления изучаемого явления. Следовательно, субъективное отбрасывание «выделяющихся» единиц недопустимо.

Как отмечалось неоднократно, в экономико-статистических исследованиях в обычных условиях применяется гипотеза о нормальном характере распределения изучаемых признаков с параметрами . Пусть при проведении одного из наблюдений за данной совокупностью были получены значений , среди которых максимальное значение (или минимальное , или даже и максимальное, и минимальное) резко отличается по своей величине от остальных наблюдений (см. табл.).

Кол-во единиц совокупности

Минимальные значения

Максимальные значения

Разность смежных значений

Среднее значение

Среднеквадратическое отклонение

хnn-1

184

7

13

130

178

6

48

57,3

35,3

Возникает вопрос, относится ли (относятся ли) это (эти) значение (значения) к данной совокупности в изучаемых условиях или есть результат экстраординарных обстоятельств.

Сформулируем нулевую гипотезу : значение принадлежит этой же совокупности, что и все остальные значений. Другими словами, рассматриваем гипотезу , что не является результатом ошибки наблюдения или изменения общих условий формирования уровней рассматриваемых признаков.

Проверка этой гипотезы состоит в том, что сравнивается по величине с определенной критической границей возможных значений х.

Область нулевой

принятия гипотезы

Нулевая гипотеза отвергается

Нулевая гипотеза отвергается

Рис. 14.1 Двухсторонняя критическая область

Область принятия нулевой гипотезы

Критическая область

а) область больших положительных отклонений

0

б) область больших отрицательных отклонений

Рис 14.2. Левосторонняя и правосторонняя критическая область

Если выделяющимся значением является , то сравнивается с верхней допустимой границей, выбранной таким образом, чтобы вероятность превзойти ее была равна уровню значимости. В данном случае будет иметь место критическая область вида (см. рис. 14.2, а):

.

Если , то гипотеза отклоняется. Если проверяется принадлежность (наименьшего значения), то надо сравнивать с нижней границей области допустимых значений , т.е. (см. рис. 14.2, б).

Если же испытанию одновременно подлежат и максимальное, и минимальное значения, то критическая область будет иметь вид (см. рис. 14.1).

.

В приведенном примере минимальное значение незначительно отличается от (только на 6 единиц), тогда как (заметно больше ). Следовательно, необходимо проверить, принадлежит ли к рассматриваемой совокупности.

Для больших выборочных совокупностей для этой цели используются табличные значения нормированной функции Лапласа. При уровне значимости значение нормированной функции Лапласа для рассматриваемый критической области будет равна 0,49= . Этому значению соответствует . Тогда верхняя допустимая граница значений признака, которая не может быть превышена с вероятностью 0,99 будет равна .

Критерий для : . Отсюда .

Значение =178 выходит за рассчитанную границу. Итак получаем в результате проверки вывод, что с вероятностью 0,99 можно утверждать, что не принадлежит к изучаемой совокупности и это значение признака следует исключить из дальнейших расчетов.

При проверке данной гипотезы можно использовать по генеральной совокупности; но они обычно неизвестны. Поэтому для малых выборок t -критерий не надежен. Для проверки гипотезы о принадлежности «выделяющихся» единиц генеральной совокупности для малых выборок рекомендуется пользоваться критерием Ф. Груббса. Критерий Груббса основан на вычислении коэффициента по формуле (для испытания )

, где

при и .

Для испытания наименьшего значения х1 эти расчеты будут иметь следующий вид .

Расчетная величина этого отношения ( .) сравнивается с табличной величиной ( .) при определенном числе наблюдений и заданном уровне значимости. Если , то проверяемая гипотеза принимается. Если же , то значение (или ) следует из дальнейших расчетов исключить. Таким образом Ктабл характеризует ту предельную величину расхождений в суммах квадратов отклонений, которая с вероятностью может быть объяснена случайными причинами.

Пример. Отклонения деталей от номинального размера оказались такими (мм): 0,07; 0,09; 0,10; 0,12; 0,13; 0,15; 0,16; 0,17 и 0,25.

Исходя из предположения о нормальном законе распределения данного признака в генеральной совокупности проверим, содержат ли эти данные ошибки наблюдения. Резко выделяется .

Вычисления: и ;

и . При расчете и .

исключили =0,25.

Отсюда отношение двух сумм квадратов отклонений будет равна

;

При числе наблюдений n=9 и уровне значимости 0,01 по таблице Ф. Груббса имеем =0,2411. Следовательно, . Если бы проверку выполняли при уровне значимости 0,05 имели бы =0,3742. И в этом случае . Отсюда отклонение номинального размера 0,25мм следует отнести к ошибкам наблюдения.

Таблица Ф. Груббса (выдержка)

Число наблюдений n

Уровень значимости

0,01

0,05

5

0,0442

0,1270

9

0,2411

0,3742

10

0,2831

0,4154

15

0,4401

0,5559

20

0,5393

0,6379

25

0,6071

0,6923

Имеются и другие критерии (варианты) проверки гипотезы о принадлежности выделяющихся наблюдений (единиц) генеральной совокупности (например, критерий Ирвина).