Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по Статистике .doc
Скачиваний:
252
Добавлен:
24.03.2015
Размер:
3.19 Mб
Скачать

1.2 Общая схема проверки гипотез

Проверка любой статистической гипотезы включает в себя следующие этапы:

1.Формулировка двух гипотез : нулевой ( рабочей ) -Н0 и альтернативной –НА. Выбор нулевой гипотезы определяется с одной стороны практическими соображениями, а с другой законом распределения так называемого критерия. Практическая сторона состоит в следующем - в качестве нулевой гипотезы рекомендуется выдвигать предположение противоположное тому, во что изначально верит исследователь ( экспериментатор ). Дело в том , что из теории проверки гипотез следует, что если была принята нулевая гипотеза, то она не является единственно верной. Если же нулевая гипотеза была отвергнута и принята альтернативная ( противоположная ), то вывод этот является однозначным. Экспериментатор заинтересован в однозначном выводе, поэтому свое предположение ( «свою веру») он относит к альтернативной гипотезе.

О связи распределения критерия и выбора нулевой гипотезы будет сказано далее. В противоположность нулевой гипотезы выдвигается гипотеза альтернативная. В ходе проверки приходим к выводу о справедливости или нулевой , или альтернативной гипотезы.

2. Выбор критерия. Статистический критерий – это инструмент для проверки выдвинутых гипотез. По своему содержанию статистический критерий – это некая случайная величина , имеющая алгоритм расчета и закон распределения. Поскольку критерий имеет алгоритм расчета, его значение может быть рассчитано по выборке ( так называемое фактическое значение критерия- ) . А так как критерий имеет функцию ( закон распределения ) можно определить вероятность появления тех или иных значений критерия. Выбор критерия зависит во –первых от содержания гипотезы , то есть о чем выдвигается гипотеза : о распределении численности, о средней генеральной , о дисперсии генеральной совокупности и так далее, а во- вторых, от численности выборки, на основе которой проверяется гипотеза. Все статистические критерии подразделяются на параметрические и непараметрические . Параметрические критерии для своего использования выдвигают по отношению к выборке некие предварительные условия например, о законе ее распределения. Непараметрические критерии по отношению к выборке никаких предварительных условий не выдвигают. Выводы сделанные на основе параметрических критериев являются более надежными, поэтому им должно отдаваться предпочтение.

3. Выбор уровня значимости. Поскольку критерий имеет закон распределения , можно установить вероятность появления любых значений критерия, в том числе таких , вероятность появления которых настолько мала, что ей можно пренебречь или иными словами считать такое событие «неправдоподобным» . В качестве нулевой гипотезы выдвигается предположение , при котором критерий вполне ( то есть с достаточно высокой вероятностью ) может принимать определенный круг значений. В качестве же альтернативной - предположение, при котором критерий принимает такой круг значений , вероятностью появления которых можно пренебречь. Круг значений ( область значений ) при котором принимается нулевая гипотеза, называется областью согласия, область значений , при которых нулевая гипотеза отвергается – критической областью или областью отказа. Пограничные между этими областями значения критерия занесены в таблицы, и если , то критерий находится в области согласия с нулевой гипотезой, в случае- в области отказа от нулевой гипотезы. Поскольку в основе принятия решения о справедливости той или иной гипотезы лежит вероятность появления различных значений критерия и поскольку значения критерия рассчитываются по выборочным данным при принятии решения возможны ошибки . Ошибка первого рода- нулевая гипотеза верна, но она отвергается . так как критерий оказался в критической области. Нулевую гипотезу отвергаем, но все же это событие возможно и оно присутствует в генеральной совокупности. , хотя и с малой вероятностью .Ошибка второго рода – нулевая гипотеза не верна , но мы ее принимаем. Значение критерия оказалось в области согласия , но оказалось там случайно, поэтому принимаем ложную гипотезу. Вероятность отказа от ложной гипотезы называется мощностью критерия

Вероятность допущения ошибки первого рода – есть уровень значимости. Одновременно уровень значимости – это совокупная вероятность появления таких значений критерия, при которых отвергается нулевая гипотеза. Иногда уровень значимости трактуется упрощенно, как вероятность ошибки окончательного вывода относительно выдвинутых гипотез. Как правило , уровень значимости устанавливается самим исследователем не выше значения , стандартными уровнями значимости являются значения равные 0,05 и 0,01.

Из сказанного следует , что соотношение между областями согласия и критической регулируется уровнем значимости. На практике при статистической обработке результатов всегда следует предварительно оценивать материальные потери при допущении ошибок первого и второго рода. Тем ошибкам, которые влекут большие материальные потери должно отдаваться предпочтение , то есть они должны минимизироваться. Ошибки первого рода минимизируются путем уменьшения уровня значимости, ошибки второго рода, наоборот, увеличением уровня значимости до допустимых ( 0,10 ) значений

4.Расчет фактического значения критерия. Установление области его нахождения Поскольку , как уже говорилось ранее , критерий имеет алгоритм расчета, по выборке определяется его фактическое значение , затем сравнивая это значение с табличнымформулируется вывод о справедливости одной из выдвинутых гипотез. Причем, выводы должны быть адекватны содержанию гипотезы и алгоритму проверки. Заключение следует делать с обязательной ссылкой на то , что оно сделано на основе выборке и о справедливости гипотезы можно говорить только с гарантией равной 1-

Вопросы для повторения

9-1.Что есть статистическая гипотеза ?

9-2.Какая присутствует связь между научной и статистической гипотезами ?

9-3.Каково должно быть содержание нулевой гипотезы ?

9-4.Что такое статистический критерий ?

9-5. Каково содержание области согласия ?

9-6. Каково содержание критической области ?

9-7.Что представляют собой уровень значимости ?

9-8. В чем состоит содержание ошибок первого рода ?

9-9. В чем состоит содержание ошибок второго рода ?

Резюме

Знание содержания статистических гипотез , общей схемы их проверки позволяет осуществить проверку любой гипотезы, грамотно сформулировать выводы , вытекающие из результатов проверки.

Тестовые задания к лекции

ТЕСТ 4-1

Что такое статистическая гипотеза ?

  1. Предположение о необходимом соотношении генеральной и выборочной совокупностей

  2. Предположение об алгоритмах расчета параметров выборочной совокупности

  3. Предположение о статистической характеристике или о законе распре деления генеральной совокупности

  4. Предположение о возможных ошибках выборки

ТЕСТ 4-2

На основании чего делается заключение относительно выдвинутой статистической гипотезы ?

  1. На основе интуиции

  2. На основе предшествующего опыта

  3. На основе выборочной совокупности

  4. На основе попытки изучить всю генеральную совокупность

ТЕСТ 4- 3

Сколько гипотез должно быть выдвинуто на первом этапе их проверки ?

  1. Две

  2. Одна

  3. Неограниченное число

ТЕСТ 4-4

Что такое уровень значимости ?

  1. Весомость вывода о гипотезе в ходе его дальнейшего практического использования

  2. Вероятность допустить ошибку первого рода при формулировании вывода относительно выдвинутой гипотезы

  3. Величина указывающая на целесообразность повторной проверки выдвинутой гипотезы

ТЕСТ 4-5

Что представляет собой ошибка первого рода ?

  1. Отказ от верной нулевой гипотезы

  2. Принятие ложной нулевой гипотезы .

  3. Ошибка при расчете фактического значения критерия

  4. Ошибка в формулировке вывода относительно выдвинутой нулевой гипотезы

ТЕСТ 4-6

Что представляет собой ошибка второго рода ?

  1. Отказ от верной нулевой гипотезы

  2. Принятие ложной нулевой гипотезы .

  3. Ошибка при расчете фактического значения критерия

  4. Ошибка в формулировке вывода относительно выдвинутой нулевой гипотезы

ТЕСТ 4-7

Если уровень значимости уменьшить , то вероятность допущения какого рода ошибки снижается ?

  1. Первого рода

  2. Второго рода

  3. Ошибок первого и второго рода

ТЕСТ 4-8

Если уровень значимости увеличить, то вероятность допущения какого рода ошибки уменьшается ?

  1. Первого рода

  2. Второго рода

  3. Ошибок первого и второго рода

ТЕСТ 4-9

Что такое статистический критерий ?

  1. Математический инструмент для проверки выдвинутых гипотез

  2. Некоторое соотношение между генеральной и выборочной совокупностью позволяющее на основе выборки без больших погрешностей сделать заключение о генеральной совокупности

  3. Случайная величина .имеющая закон распределения

ТЕСТ 4-10

Что представляет собой фактическое значение критерия ?

  1. Значение критерия , рассчитанное по генеральной совокупности

  2. Значение критерия, рассчитанное по выборочной совокупности

  3. Значение критерия , полученное в ранее проведенных исследованиях

  4. Среднее из нескольких полученных по выборкам значений критерия

ТЕСТ 4-11

Что представляет собой табличное ( критическое ) значение критерия ?

1. Это значение критерия, при сравнении с которым формулируется вывод относительно выдвинутых гипотез

2. Это максимально возможное в силу игры случая значение случай ной величины, получившей название критерия

3.Это такое значение критерия, которое позволяет установить правильно или нет произведены расчеты по выборке

ТЕСТ 4-12

Что такое область согласия ?

1. Все возможные значения критерия, при которых принимается альтернативная гипотеза

2. Все возможные значения критерия , при которых приходим к выводу о необходимости повторной проверки выдвинутой гипотезы

3. Все возможные значения критерия, при которых соглашаемся с выдвинутой нулевой гипотезой

4.Все возможные значения критерия, при которых соглашаемся о возможном согласии как с нулевой , так и с альтернативной гипотезой.

ТЕСТ 4-13

Что представляет собой критическая область ?

  1. Все возможные значения критерия, при которых принимается нулевая гипотеза

  2. Все возможные значения критерия , при которых не может быть принята ни нулевая, ни альтернативная гипотеза

  3. Все возможные значения критерия, при которых есть основание принять альтернативную гипотезу

ТЕСТ 4-14

При каких фактических значениях критерия обычно принимается нулевая гипотеза ?

1. Только при равных табличному

2. Только при значениях больше табличного

3 .При значениях меньше или равных табличному

ТЕСТ 4-15

При каких фактических значениях критерия нулевая гипотеза обычно отвергается ?

1. Только при равных табличному

2. Только при значениях больше табличного

3 .При значениях меньше или равных табличном

Лекция 5 Проверка гипотез о распределении численностей. Критерий Пирсона

Аннотация

Одним из основных типов гипотез являются гипотезы о распределении численностей. При распределении единиц по одному признаку признание справедливой одной из выдвинутых гипотез позволяет в последующем прогнозировать распределения. При распределении единиц по двум признакам проверка гипотез позволяет установить наличие или отсутствие взаимосвязи между признаками

Ключевые слова

Критерий Пирсона. Аспект согласия, аспект независимости, аспект однородности.

Рассматриваемые вопросы

  1. Критерий как критерий согласия

  2. Критерий как критерий независимости

  3. Критерий как критерий однородности

Модульная единица 1

Критерий как критерий согласия

Цель и задачи изучения модульной единицы

В результате изучения данного аспекта использования критерия студент должен закрепить общую схему проверки статистических гипотез уяснить алгоритм расчета фактического значения критерия и особенности нахождения его табличного значения.

Одним из важнейших типов статистических гипотез являются гипотезы о распределении численности. Предпочтение при проверке такого рода гипотез должно отдаваться критерию - Пирсона. Данный критерий является параметрическим. Важнейшим условием применения этого критерия является независимость наблюдений по группам ( интервалам ). Кроме того, имеется чисто количественное ограничение, состоящее в том, что в каждом интервале должно быть не менее 5 ( пяти ) единиц наблюдений. Если число наблюдений меньше 5, этот интервал следует объединить с соседним . Объединение производят до тех пор пока в объединенном интервале будет не менее 5 единиц. Критерийиспользуется в 3-х аспектах ( вариантах ) – как критерий согласия, как критерий независимости и как критерий однородности. Как критерий согласия критерийиспользуется в том случае, если требуется проверить гипотезу о соответствии фактического распределения теоретическому ( ожидаемому ).

Последовательность проверки гипотез о распределении численностей с использованием критерия в аспекте согласия рассмотрим на примере

Имеются выборочные данные о распределении коров определенной породы по жирности молока ( в таблице 5.1.1 это фактические численности ). Требуется установить соответствует ли распределение коров всей породы ( в генеральной совокупности ) по жирности молока пропорции 1:2 :4 :2:1

Таблица 5.1.1

К проверке гипотезы о соответствии фактического распределения коров по жирности молока ожидаемому

Этапы расчета

критерия

Формула

расчета

Процент жира в молоке

до 3.40

3,40-3,50

3,51-3,60

3,61-3,70

Свыше 3,70

Фактические численности

ni

104

188

383

196

129

Ожидаемые численности

ñi

100

200

400

200

100

Разности

ni - ñi

+4

-12

-17

-4

+29

Квадрат разности

(ni - ñi )

16

144

289

16

841

Отношение

(ni - ñi )/ ñi

0,16

0,72

0,72

0,08

8,41

В соответствии с общей схемой проверки гипотез на первом этапе выдвигаются две противостоящие друг другу гипотезы: Н0 ( нулевая гипотеза ) – распределение коров по жирности молока соответствует ожидаемой пропорции 1:2:4:2: 1 и НА (альтернативная гипотеза ) распределение коров обозначенной пропорции не соответствует. Такая постановка нулевой гипотезы связана с тем , что распределение таково , что вероятность появления значений соответствующих альтернативной гипотезе весьма незначительна . В конечном счете должна быть признана справедливой одна из этих гипотез, а вторая , соответственно отвергнута .

В качестве критерия для проверки выдвинутых гипотез можно использовать параметрический критерий , поскольку наблюдения по группам независимы друг от друга.

Далее следует установить уровень значимости (α )и соответственно 1- α = β -достоверность вывода. Примем для нашего примера α=0,01 и =0,99

На третьем этапе необходимо рассчитать фактическое значение критерия по формуле : факт = , где- фактические численности по группам ( интервалам)- ожидаемые численности, причем в качестве ожидаемых берутся численности соответствующие нулевой гипотезе (Н0 ), то есть численности соответствующие пропорции 1:2:4:2:1

В таблице 5.1.1 представлены последовательные этапы расчета фактического значения критерия , при этом ожидаемые численности устанавливались следующим образом : определялась общая численность выборки ( 1000 голов ) затем эта общая численность разбивалась по группам в пропорции 1:2:4:2:1. исходя из того, что на одну часть приходится 1000:10 = 100 единиц ( голов ). В целом же, при проверке гипотезы о соответствии фактического распределения ожидаемому, ожидаемые частоты следует определять умножая последовательно общую численность выборки на теоретическую вероятность появления тех или иных значений признака, по которому построено распределение.

Фактическое значение критерия определим суммируя отношения

(ni - ñi )/ ñi по последней строке таблицы факт = 0,16+0,72+0,72+0,08 +8,41 = 10,09.

На заключительном этапе проверки статистических гипотез фактическое значение критерия необходимо сравнить с его табличной ( критической ) величиной. В нашем примере табл определяется принятым уровнем значимости ( α=0,01) и числом степеней свободы, которое при данном аспекте применения критерия равноdf( , где= 5 – число интервалов ( групп ),k- число параметров определяющих теоретическое ( ожидаемое ) распределение. Поскольку в нашем примере ожидаемое распределение носит опытный характер k=0 число степеней свободы будет равно df( = 5-1 =4, Следовательно,табл=13,28. Поскольку фактическое значение критерия ( 10,09 ) оказалось меньше табличного ( 13.28 ) справедливой должна быть признана нулевая гипотеза – с вероятностью ошибки в 1% распределение коров данной породы по жирности молока соответствует пропорции 1: 2 :4 :2 :1 .

Вопросы для повторения

10-1. Какие гипотезы проверяются с использованием критерия в качестве критерия согласия ?

10-2.Какая нулевая гипотеза выдвигается при проверке гипотезы о соответствии фактического распределения ожидаемому ?

10-3.Какова формула расчета фактического значения критерия ?

10-4. Как рассчитать ожидаемые частоты ?

10-5. От чего зависит табличное значение критерия при использовании его в качестве критерия согласия ?

Резюме

Установив соответствие фактического распределения ожидаемому, можно прогнозировать ожидаемые численности по группам , интервалам, исходя из общей численности совокупности

Модульная единица 2 -как критерий независимости

Цель изучения данной модульной единицы - освоить еще один аспект использования критерия , который имеет весьма широкое применение при обработке экспериментальных данных, когда эти данные носят характер распределения численностей ( растений, животных, земельных участков ) и предназначены для установления наличия или отсутствия взаимосвязи между признаками.

в качестве критерия независимости используется в том случае, если выборочная совокупность распределена одновременно по 2- м признакам и необходимо установить зависит ли распределение по одному признаку от распределения по другому. Выборочные данные в этом случае могут быть представлены в виде такой , например, таблицы с двумя входами, где по первому признаку выделено три группы интервала k=3, а по второму четыре l=4 :

Группы ( интервалы по первому признаку

Группы ( интервалы ) по второму признаку

Итого по строкам

а

В

с

d

А

В

С

...

Итого по столбцам

=n

В качестве нулевой гипотезы выдвигается предположение, что распределение по первому признаку не зависит от распределения по второму. Такая постановка нулевой гипотезы определяется во-первых тем, что этой гипотезе принадлежит абсолютное большинство возможных значений критерия, а во-вторых исследователь, как правило верит в то , что эта зависимость имеет место, поэтому в качестве нулевой гипотезы выдвигается противоположное предположение. Альтернативной гипотезой будет предположение о наличии взаимосвязи между распределениями С практической точки зрения справедливость нулевой гипотезы означает отсутствие взаимосвязи между признаками, справедливость альтернативной – наличие такой взаимосвязи в генеральной совокупности.

В качестве критерия воспользуемся критерием , при этом надо предварительно подтвердить отсутствие внутри групп взаимосвязи между наблюдениями. Фактическое значение критерияпри использовании его в качестве критерия независимости определяется по той же формуле, что и аспекте согласия, при этом , поскольку распределение имеет место 2- м признакам формула несколько усложняется , то есть отношениядолжны быть просуммированы вначале по строкам, а затем по столбцам ( или наоборот ) , то есть

Ожидаемые частоты должны соответствовать нулевой гипотезе о независимости распределений; математически это означает, что распределение единиц по столбцам внутри каждой строки должно таким же, как по столбцам распределяется вся совокупность и соответственно распределение единиц по строкам внутри каждого столбца должно быть таким каково распределение единиц по строкам в целом по совокупности. Этот принцип реализуется в формуле , то есть для нахождения ожидаемой частоты с координатами : строкаs и столбец p надо обратиться к фактическим частотам , найти произведение итога по строке s на итог по столбцу р и полученное произведение разделить на общую численность совокупности. Действительно, эта формула адекватна выше указанному принципу поскольку отношение - это доля строкиs в общей численности совокупности и эту долю мы распространяем на то есть на столбецp . Отношение есть доля столбцар в общей численности совокупности и эту долю мы распространяем на строку s.

При определении ожидаемых частот естественно следует производить округление до целых значений. Правильность расчета ожидаемых частот проверяется сравнением итогов по строкам и столбцам для фактических и ожидаемых частот. Эти итоги должны совпадать ( за счет округления могут иметь место несовпадения в несколько единиц ). Численность каждой ожидаемой частоты должна превышать 5 единиц, в противном случае прежде чем рассчитывать фактическое значение критерия следует произвести объединение интервалов.

В заключение найденное фактическое значение критерия (факт ) следует сравнить с табличным (табл ), при этом табличное значение зависит от установленного уровня значимости и от числа степеней свободы, которое в данном аспекте использования критерия рассчитывается по формулеdf ( = (k-1)(l=1), где к и l - соответственно число строк и столбцов. В зависимости от соотношения факт и табл принимается соответственно или нулевая или альтернативная гипотезы.

Вопросы для повторения

11-1. В каком случае критерий используется как критерий независимости ?

11-2. Какая гипотеза выступает в качестве нулевой при использовании критерия в аспекте независимости ? Почему ?

11-3.Какой алгоритм расчета фактического значения критерия используется при использовании его в качестве критерия независимости ?

11-4. Какие практические выводы следуют при принятии нулевой и альтернативной гипотез?

11-5. Какой математический принцип используется для нахождения ожидаемых частот ?

11-6. Каков алгоритм расчета ожидаемых частот ?

11-7. Как проверить правильность расчета ожидаемых частот ?

11-8. Как установить число степеней свободы при использовании критерия как критерия независимости ?

Резюме

Рассмотренный аспект применения критерия имеет самое широкое практическое использование. При его реализации следует максимально уделить внимание правомерности использования названного критерия и достаточной численности наблюдений по интервалам.

Модульная единица 3 - как критерий однородности

Цель изучения этой модульной единицы освоить своеобразный аспект применения критерия . Своеобразность его состоит в постановке гипотез, а также в алгоритме расчета фактического значения критерия

Как критерий однородности используется в том случае , если имеются две выборочных совокупности, каждая из которых распределена по одному и тому же признаку . Требуется установить одинаковым или нет является распределение двух генеральных совокупностей , из которых сделаны выборки. С практической точки зрения проверка этой гипотезы позволяет установить сходны или нет между собой состав (структура ) двух генеральных совокупностей , что в свою очередь дает основание применять одинаковые или разные методы управления этими совокупностями .

В качестве нулевой гипотезы выдвигается предположение , что две генеральные совокупности однородны по составу. Данная постановка нулевой гипотезы соответствует подавляющему большинству значений критерия. В качестве альтернативной гипотезы выдвигается предположение, что совокупности не однородны.

Особенность расчета фактического значения критерия при использовании его в этом аспекте состоит в том , что в отличие от ранее рассматриваемых аспектов, где фактические частоты сравниваются с ожидаемыми ( теоретическими ), в данном аспекте фактическое значение критерия находится на основе частот двух выборок :

, где - численность каждойj – ой из к групп в первой совокупности ; - общая численность первой выборочной совокупности ;- численность каждойj- ой из к групп второй совокупности ; - общая численность второй выборочной совокупности ;- доля каждойj –ой группы в первой выборке ; - доля каждойj- ой группы во второй выборочной совокупности ;

+ - общая численность группыj в обеих выборочных совокупностях. Исходя из приведенной формулы фактическое значение критерия при рассматриваемом аспекте его использования зависит в первую очередь от разности в долях каждой из групп в выборках, а также от «веса» этих групп в изучаемых совокупностях, который выражается в сумме+. Табличное значение критерияпри данном аспекте его использования определяется уровнем значимости () и числом степеней свободы, которое равноdf (= k -1, где k , как уже говорилось , число групп, на которое подразделена каждая из совокупностей.

Сопоставляя фактическое значение рассматриваемого критерия с табличным формулируется соответствующий вывод.

Вопросы для повторения

12-1.В каком случае критерий используется как критерий однородности ?

12-2. Как формулируется нулевая гипотеза при рассматриваемом аспекте применения критерия ?

12-3. При каком аспекте использования критерия при расчете его фактического значения не используются ожидаемые ( теоретические численности )

12-4. От каких величин зависит, главным образом, фактическое значение критерия при использовании его в рассматриваемом аспекте ?

12-5. Как установить число степеней свободы при нахождении табличного значения критерия

Резюме

Последний из рассматриваемых аспектов использования критерия позволяет сделать вывод , что в совокупности с ранее рассматриваемыми аспектами применение изучаемого критерия позволяет использовать выборочные совокупности для всесторонней проверки генеральных совокупностей на предмет схожести их структур , соответствия распределения теоретическому, наличия взаимосвязей

Тестовые задания к лекции

ТЕСТ 5-1

Какие из названных критериев используются при проверке гипотез относительно распределения численностей

  1. Критерий t - Стьюдент

  2. Критерий F- Фишера

  3. Критерий Госсета

  4. Критерий Тьюки

  5. - Пирсона

ТЕСТ 5- 2

Если требуется проверить гипотезу о соответствии фактического распределения нормальному, то в каком аспекте используется в этом случае критерий -Пирсона ?

  1. Как критерий согласия

  2. Как критерий независимости

  3. Как критерий однородности

ТЕСТ 5-3

Если требуется установить по данным выборочного распределения взаимосвязаны ли специализация предприятий и степень их убыточности, то в каком аспекте используется критерий -Пирсона ?

1. Как критерий согласия

2. Как критерий независимости

3. Как критерий однородности

ТЕСТ 5-4

Если требуется установить на основе двух выборок одинаков ли состав

полей по степени их засоренности , то критерий -Пирсона исполься как критерий …..

1……однородности

2…….независимости

3…….однородности

ТЕСТ 5-5

В формуле для расчета фактического значения критерия -Пирсона :

= ,что представляют собой ?

1. Фактические численности по группам ( интервалам ) выборки

2. Ожидаемые численности по группам ( интервалам )

3. Долю каждого интервала в общей численности выборки

ТЕСТ 5- 6

В формуле для расчета фактического значения критерия -Пирсона=,что представляют собой

1. Фактические численности по группам ( интервалам ) выборки

2. Ожидаемые численности по группам ( интервалам

3. Долю каждого интервала в общей численности выборки

ТЕСТ 5-7

В чем может состоять источник ( причина ) разности ?

1. В ошибке расчета ожидаемых часто

2. В игре случая

3. В существенном отличии фактического распределения от ожидаемого

ТЕСТ 5-8

В чем смысл ожидаемых частот ( ) при использовании критерия -Пирсона в качестве критерия согласия

1. Так распределялась бы выборочная совокупность в соответствии с нулевой гипотезой

2. Так распределялась бы выборка при соответствии фактического

распределения ожидаемо

3. Это некоторое стандартное распределение, которое должно присутствовать в любом случае

ТЕСТ 5-9

Как проверить правильность расчета ожидаемых частот

1. Провести расчеты повторно

2. Сравнить на отличие от 0 ( нуля ) суммы фактических и ожидаемых частот

3.Сравнить на отличие от 0 ( нуля )

ТЕСТ 5-10

В чем смысл ожидаемых частот при использовании критерия -Пирсона как критерия независимости ?

1. Такие частоты должны иметь место при независимости распределений по двум признакам

2. Такие частоты должны иметь место при справедливости нулевой гипотезы

3.Это некий постоянный стандарт с каким должны сравниваться все распределения по 2- м признакам.

ТЕСТ 5-11

На основе какого принципа находятся ( рассчитываются ) ожидаемые частоты при проверке гипотезы о независимости распределений ?

  1. Внутри каждой группы . выделенной по первому признаку, распределение по второму признаку должно быть одним и тем же

  2. Внутри каждой группы , выделенной по второму признаку , распределение по первому должно быть таким как и в целом по совокупности

  3. Внутри каждой группы , выделенной по второму признаку распределение единиц по первому признаку должно быть одним и тем же

ТЕСТ 5-12

Как проверить правильность расчета ожидаемых частот при использовании критерия -Пирсона в качестве критерия независимости

1.Повторным расчетом

2. Сравнением сумм фактических и ожидаемых частот по столбцам и строкам таблиц распределения по 2- м признакам

3.Сравнением общей численности фактических и ожидаемых частот.

ТЕСТ 5-13

Если в каком –либо интервале ( группе ) его частота оказалось менее

5 единиц , каковы будут последующие действия ?

  1. Исключить данную группу из последующих расчетов

  2. Объединить данный интервал с соседним и независимо от численности объединенного интервала продолжить расчеты

  3. Осуществлять объединение до тех пор , пока в объединенном интервале будет не менее 5 единиц

  4. Проигнорировав этот факт , продолжать расчеты

ТЕСТ 5-14

От чего зависит табличное значение критерия -Пирсона ?

1. От численности выборки ( выборок )

2.От числа выделенных групп ( интервалов )

3.От числа степеней свободы

4.От уровня значимости

ТЕСТ 5-15

При каком из аспектов использования критерия -Пирсона в алгоритме расчета фактического значении критерия отсутствуют ожидаемые частоты ?

  1. Как критерий согласия

  2. Как критерий однородности

  3. Как критерий независимости

ТЕСТ 5-16

Что играет решающую роль в формуле для определении фактического

значения критерия -Пирсона при его использовании в качестве критерия однородности ?

  1. Численность первой выборки

  2. Численность второй выборк

  3. Разница в долях по каждой группе

Лекция 6

Проверка гипотез относительно средних по данным одной и двух выборок

Аннотация

В данной лекции будут представлены алгоритмы проверки гипотез относительно одного из важнейших параметров генеральной совокупности- среднего значения признака. Кроме того, будут освещены вопросы проверки гипотез относительно доли признака и принадлежности резко выделяющихся значений признака исследуемой совокупности. Поскольку речь идет о проверке гипотез, изложение материала будет соответствовать общей схеме проверки гипотез изложенной ранее.

Ключевые слова

Гипотеза, генеральная средняя, выборки зависимые, выборки независимые, критерий t - Стьюдента, критерий t –нормального распределения, - преобразование.

Рассматриваемые вопросы

1. Поверка гипотезы относительно генеральной средней. Гипотеза направленная и ненаправленная.

2. Проверка гипотезы относительно средних по данным двух выборок. Выборки зависимые и независимые.

3.Проверка гипотезы относительно долей признака

4. Проверка гипотезы о принадлежности резко выделяющихся значений признака исследуемой совокупности.

Модульная единица 1 Проверка гипотезы относительно генеральной средней . Гипотеза направленная и ненаправленная

Цель и задачи изучения модульной единицы состоят в освоении алгоритма проверки гипотезы относительно генеральной средней по данным большой и малой выборок, в установлении содержания ненаправленных и направленных гипотез и особенностей их проверки

Проверка гипотезы относительно генеральной средней включает в себя следующие этапы :

1) Формулировка нулевой и рабочей гипотез. В качестве нулевой гипотезы выдвигается предположение Такая постановка нулевой гипотезы отражает особенности распределения критериев, используемых для проверки выдвинутых гипотез, а также тот факт, что исследователь чаще всего уверен в том , что. В качестве альтернативной гипотезы могут быть выдвинуты две( ненаправленная альтернативная гипотеза ) иили( направленная альтернативная ) гипотеза.

2) Выбор критерия . В качестве критериев для проверки выдвинутых гипотез могут использоваться два : критерий t –нормального распределения ( если численность выборки, на основе которой проверяется гипотеза более 30 единиц ) или критерий t - Стьюдента ( если численность выборки менее 30 единиц ).

3 ) Установление уровня значимости. Подход к уровню значимости традиционен, хотя здесь особое внимание следует уделить анализу и сопоставлению ошибок первого и второго рода.

4) Расчет фактического значения критерия . Как критерий t –нормального распределения, так и критерий t - Стьюдента определяются по данным выборки по одному и тому же алгоритму , где- рассчитанное по выборке значение средней ; -предполагаемое в генеральной совокупности среднее значение признака ; =- средняя ошибка выборочной средней , при условии , что среднее квадратическое отклонение по выборке составило величинуS, а численность выборки равна n

5 )Табличное значение критерия при ненаправленной альтернативной гипотезе устанавливается следующим образом : табличное значение критерия t –нормального распределения зависит только от уровня значимости, табличное значение критерия t - Стьюдента – от уровня значимости и числа степеней свободы , равного d f () = n-1

В случае направленной гипотезы, как видно из ее содержания, критическая область присутствующая при ненаправленной гипотезе разделяется на две части- одна часть остается в критической области , а другая переходит в область согласия. Например, при ненаправленной гипотезе к критической области будут относятся все значения критерия независимо от знака, то есть , строго говоря, значение критерия следует брать по модулю. При направленной альтернативной гипотезе, например,, к критической области будут относится фактические значения критерия,при условии что они положительные, отрицательные значения фактического значения критерия по модулю превосходящие табличное значение относятся к области согласия .

Отсюда следует: поскольку соотношение между областями согласия и критической регулируется уровнем значимости, при направленной альтернативной гипотезе чтобы выйти на установленный заранее уровень значимости, табличное значение следует брать с удвоенным его уровнем (), хотя окончательный вывод формулируется с принятым заранее уровнем.

6) Формулировка окончательного вывода относительно выдвинутых гипотез происходит по традиционной схеме : еслипринимается, если- альтернативная с учетом ее содержания

( направленная или ненаправленная )

Вопросы для повторения

13-1.Чем отличаются направленная и ненаправленная альтернативные гипотезы ?

13-2. Какие критерии используются при проверке гипотезы относительно генеральной средней ?

13-3.Каков алгоритм расчета фактического значения критерия ?

13-4. Совпадают или нет критические области при направленной и ненаправленной альтернативной гипотезах?

13-5. Как установить табличное значение критерия при направленной и ненаправленной гипотезах ?

Резюме

При традиционной схеме проверки гипотез относительно генеральной средней следует обратить внимание на выбор критерия ( t –нормального распределения или критерий t - Стьюдента ) , а также на содержание альтернативной гипотезы ( ненаправленная или направленная )

Модульная единица 2 Проверка гипотезы относительно средних по данным двух выборок.

Цель и задачи изучения модульной единицы состоят в освоении схемы и алгоритмов проверки гипотез , лежащих в основе статистической обработки экспериментов , представленных двумя вариантами : типа «контроль» - «опыт»

Если имеют место две выборки , то они могут быть зависимыми и независимыми. В двух зависимых выборках наблюдения попарно взаимосвязаны некой общностью, в независимых такая взаимосвязь отсутствует.

Отнесение выборок к зависимым и независимым меняет постановку гипотез и соответственно алгоритм их проверки.