Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по Статистике .doc
Скачиваний:
252
Добавлен:
24.03.2015
Размер:
3.19 Mб
Скачать

2.2 Проверка гипотезы относительно средней по данным двух зависимых выборок

При зависимых выборках в качестве нулевой гипотезы выдвигается предположение, что средняя разность попарно взаимосвязанных наблюдений в генеральной совокупности равна 0 ( нулю ) , то есть , в качестве альтернативной ненаправленной, альтернативной направленнойили.

В качестве критерия для проверки выдвинутых гипотез может быть использован критерий t – нормального распределения, если число пар взаимосвязанных наблюдений более 39 или критерий t – Стьюдента, если число пар наблюдений равно или менее 30

Фактическое значение любого из названных критериев устанавливается по формуле , гдесредняя разность дляпопарно взаимосвязанных наблюдений по 2- выборкам. Для ее нахождения вначале необходимо найти разность по каждой изпар наблюдений , то есть, а затем их среднее значение;- дисперсия попарных выборочных разностей .

Фактическое значение критерия сопоставляется с табличным, при этом если используется критерий t – Стьюдента число степеней свободы определяется по формуле d f () =

Проверка гипотезы о средней разности может быть осуществлена также с использованием НСР, которая в данном случае определяется по формуле : НСР =

Вопросы для повторения

14-1 В чем разница между выборками зависимыми и независимыми ?

14-2 Как формулируется нулевая гипотеза о средних при независимых выборках ?

14-3 Какие четыре ситуации возможны при проверке гипотезы относительно двух средних при независимых выборках?

14-4 При каких ситуациях необходим расчет усредненной дисперсии ?

14-5 В чем особенность расчета числа степеней свободы при неравных дисперсиях ?

    1. Что такое НСР?

    2. Как формулируется нулевая гипотеза при зависимых выборках ?

    3. Каков алгоритм расчета фактического значения критерия при зависимых выборках ?

Резюме

Проверка гипотезы относительно средних требует предварительного уяснения каков характер выборки ( зависимые или независимые ), и если выборки независимые к какой из 4-х ситуаций принадлежат выборочные данные. В зависимости от этого меняется алгоритм расчета фактического значения критерия и поиск его табличного значения

Модульная единица 3 Проверка гипотез относительно доли признака. Проверка гипотезы о принадлежности резко выделяющихся значений признака исследуемой совокупности

Цель изучения модульной единицы

Перед рассмотрением последующего материала сразу следует сделать оговорку, что речь идет о доле качественного альтернативного признка

Если речь идет о предположении, что в генеральной совокупности доля альтернативного признака равна некоторой величине Q, то последовательность проверки такой гипотезы будет следующей :

Выдвигаются две гипотезы Н9 : Р=Q и альтернативная РQ

В качестве критерия для проверки гипотезы относительно доли признака используется критерий t - нормального распределения , фактическое значение которого определяется по формуле , гдеp – доля единиц определенного качества по выборке, g - доля единиц противоположного качества по выборке ; n – численность выборки.

Полученное фактическое значение сравнивается с табличным, которое зависит только от уровня значимости и делается соответствующий вывод.

Если речь идет об оценке различий в долях по двум выборкам , то последовательность проверки гипотезы будет следующей :

Выдвигается нулевая гипотеза о равенстве долей в двух генеральных совокупностях , то есть:. В качестве альтернативной гипотезы может быть выдвинута ненаправленная:или направленная гипотеза:(:).

В качестве критерия для проверки выдвинутых гипотез используется критерий t - нормального распределения, который рассчитывается по двум алгоритмам : если каждая из выборочных доли () лежит в интервале, то формула для расчета фактического значения критерия будет следующей, где- доля единиц с определенным качеством по первой выборке ;- доля таких единиц по второй выборке ;,- доля единиц с противоположным качест

вом соответственно по первой и второй выборкам ; ичисленности выборок.

Если же хотя бы одна из выборочных долей лежит вне указанного выше интервала, то для расчета фактического значения критерия требуется предварительное ( фи ) преобразование выборочных долей, при этом значениянаходятся по специальным таблицам. Фактическое значение критерияt –нормального распределения находят по формуле :

, где и- преобразованные значения выборочных долей

При проверке гипотезы относительно принадлежности резко выделяющихся значений исследуемой совокупности в качестве нулевой гипотезы выдвигается предположение , что резко выделяющееся значение признака принадлежит исследуемой совокупности .

При выборе критерия возможно два варианта в зависимости от численности выборки. Если она меньше 25 единиц, то в качестве критерия следует использовать критерий Диксона. Фактическое значение данного критерия определяется по формуле : М =( для случая , когда резко выделяется максимальное значение признака ) . В этой формуле- максимальное значение признака относительно которого выдвигается гипотеза ;- значение признака предшествующее в ранжированном ряду максимальному;- минимальное в ранжированном ряду значение признака.

Для случая, когда сомнение о принадлежности вызывает минимальное значение признака , фактическое значение критерия Диксона определяется по формуле М =, где- минимальное значение признака относительно которого выдвигается гипотеза ;- следующее за минимальным в ранжированном ряду значение признака ;- максимальное значение признака.

Если численность выборки превышает 25 единиц , то в качестве критерия проверки гипотезы о принадлежности единицы исследуемой совокупности используется критерий t –нормального распределения, фактическое значение которого определяется по формуле =, где - значение признака относительно которого выдвинута гипотеза ; - среднее значение признака по исследуемой выборочной совокупности ;- среднее квадратическое отклонение признака по исследуемой выборочной совокупности

Вопросы для повторения

15-1. Как формулируется нулевая гипотеза относительно доли признака в генеральной совокупности?

15-2. Как формулируется нулевая гипотеза относительно доли признака в двух генеральных совокупностях?

15-3. Какой критерий используется при проверке гипотезы относительно доли признака ?

15-4. Как меняется расчет фактического значения критерия в зависимости от величины выборочной доли ?

15-5. Какие критерии используются при проверке гипотезы о принадлежности единицы исследуемой совокупности ?

15-6. Каковы алгоритмы расчета фактического значения критерия Диксона, если резко выделяется максимальное значение признака ? Минимальное значение признака ?

Резюме

При проверке гипотезы относительно доли единственно возможным критерием является критерий t –нормального распределения, при этом алгоритм его расчета меняется в зависимости от оценки этой доли по выборкам. При проверке гипотезы о принадлежности единицы исследуемой совокупности следует обратить внимание на ее численность, поскольку она влияет на выбор критерия.

Тестовые задания к лекции

ТЕСТ 6-1

Какую из гипотез следует отнести к направленной ?

1.

2.

3.= а

ТЕСТ 6- 2

Какой критерий используется при проверке гипотезы относительно

генеральной средней при численности выборки в 40 единиц ?

  1. t –Cтьюдента

  2. t- нормального распределения

  3. F –Фишера

  4. t- Госсета

ТЕСТ 6- 3

Дополните выражение: « Если в качестве альтернативной присутствует направленная гипотеза, то табличное значение критерия следует брать….

  1. …..с установленным заранее уровнем значимости

  2. …. с удвоенным по сравнению с заранее установленным уровнем значимости

  3. ……с уменьшенным вдвое против принятого заранее уровнем значимости

ТЕСТ 6-4

Какой критерий используется при проверке гипотез относительно средних по данным 2- выборок

1 t –Cтьюдента

2 t- нормального распределении

3 F –Фишера

4 t- Госсета

5. Критерий знаков

ТЕСТ 6-5

Какие из перечисленных ниже критериев следует отнести к непараметрическим ?

1 t –Cтьюдента

2 t- нормального распределения

3 F –Фишера

4 t- Госсета

5. Никакой из перечисленных выше

ТЕСТ 6-6

Дополните выражение : « Две выборки относятся к независимым если,,,

1. наблюдения в каждой из них не зависят друг от друга»

2. ….наблюдения по двум выборкам попарно между собой взаимосвязаны»

3….по двум выборкам отсутствует попарная взаимосвязь наблюдений»

ТЕСТ 6-7

Дополните выражение: « Две выборки относятся к зависимым , если…

1. наблюдения в каждой из них не зависят друг от друга»

2. ….наблюдения по двум выборкам попарно между собой взаимосвязаны»

3….по двум выборкам отсутствует попарная взаимосвязь наблюдений»

ТЕСТ 6-8

В случае независимых выборок нулевая гипотеза выдвигается относительно :

  1. Каждой из генеральных средних

  2. Разности между генеральными средними

  3. Средней разности по двум генеральным совокупностям

  4. Равенства генеральных средних

ТЕСТ 6-9

В случае зависимых выборок нулевая гипотеза выдвигается относительно :

  1. Каждой из генеральных средних

  2. .Разности между генеральными средними

  3. Средней разности по двум генеральным совокупностям

  4. Равенства генеральных средних

  5. Равенстве средней разности 0 ( нулю ) в двух генеральных совокупностях

ТЕСТ 6-10

Для чего при проверке гипотезы относительно двух средних должна быть проведена проверка вспомогательной гипотезы ?

  1. Чтобы установить равны ли численности выборок

  2. Чтобы установить равны ли дисперсии в генеральных совокупностях .

  3. Чтобы установить равны ли численности по выборкам и равны ли дисперсии в генеральных совокупностях

ТЕСТ 6-11

В каких из перечисленных ниже ситуаций требуется предварительный расчет усредненной дисперсии двух выборок ?

  1. Численности выборок равны, равны дисперсии по генеральным совокупностям

  2. Численности выборок не равны, но дисперсии по генеральным совокупностям равны между собой

  3. Численности выборок равны, но дисперсии по генеральным совокупностям не равны между собой

  4. Численности выборок не равны, не равны и дисперсии.

ТЕСТ 6-12

При какой ниже ситуаций для определения числа степеней свободы используется поправка ?

1.Численности выборок равны, равны дисперсии по генеральным совокупностям

2.Численности выборок не равны, но дисперсии по генеральным совокупностям равны между собой

3.Численности выборок равны, но дисперсии по генеральным совокупностям не равны

4, Численности выборок не равны, не равны и дисперсии.

ТЕСТ 6- 13

При какой из перечисленных ситуаций критическое значение критерия

является расчетной величиной ?

1.Численности выборок равны, равны дисперсии по генеральным совокупностям

2.Численности выборок не равны, но дисперсии по генеральным совокупностям равны между собой

3.Численности выборок равны, но дисперсии по генеральным совокупностям не равны между собой

4.Численности выборок не равны, не равны и дисперсии.

ТЕСТ 6-14

Если численности каждой из двух независимых выборок увеличивается, а дисперсии остаются неизменными, вероятность принятия какой гипотезы возрастает ?

  1. Нулевой

  2. Альтернативной

  3. Ни той , ни другой

ТЕСТ 6- 15

Если числа пар взаимосвязанных наблюдений уменьшается, а дисперсия разностей остается неизменной , вероятность принятия какой гипотезы возрастает ?

  1. Ни той , ни другой

  2. Альтернативной

  3. Нулевой

ТЕСТ 6-16

Что такое НСР ?

  1. Наименьшая случайная разность

  2. Наибольшая случайная разность

  3. Наименьшая существенная разность

  4. Наибольшая существенная разность

ТЕСТ 6-17

Если разность между выборочными средними больше НСР, какую из гипотез следует принять ?

1.Нулевую

2.Альтернативную

3.Ни ту , ни другую

ТЕСТ 6-18

Если выборочная средняя разность попарно взаимосвязанных наблюдений равна НСР, какую из гипотез следует принять ?

  1. Ни ту, ни другую

  2. Альтернативную

  3. Нулевую

ТЕСТ 6-19

Какой критерий используется при проверке гипотезы о равенстве долей альтернативного признака в двух генеральных совокупностях

1. t –Cтьюдента

2 t- нормального распределении

3 F –Фишер

4 t- Госсета

ТЕСТ 6-20

В каком случае при проверке гипотезы относительно долей признака в двух генеральных совокупностях требуется предварительное фи- преобразование ?

  1. Только если выборочные доли равны между собой

  2. Только если каждая из долей меньше 0,1

  3. Только если каждая из долей больше чем 0,9

  4. Если хотя бы одна из долей меньше 0,1 или больше 0,9

ТЕСТ 6-21

Если выборочные средние равны между собой, какая из гипотез должна быть принята без дополнительных расчетов ?

  1. Нулевая

  2. Альтернативная

  3. Ни та, ни другая

Лекция 7 Дисперсионный анализ

Аннотация

Большинство опытов проводимых в аграрной сфере носят многовариантный характер. Статистическая оценка результатов таких экспериментов является необходимым элементом, позволяющим, распространить результаты эксперимента в практику. Основным инструментом статистической обработки многовариантных экспериментов является дисперсионный анализ.

Ключевые слова

Дисперсионный анализ, критерий Фишера, закон разложения вариации, конкретизация результатов дисперсионного анализа, критерий Тьюки

Рассматриваемые вопросы

1.Назначение дисперсионного анализа

2.Общая схема проведения дисперсионного анализа. Критерий F- Фишера.

3.Конкретизация результатов дисперсионного анализа. Критерий Тьюки

4.Модели дисперсионного анализа.

Модульная единица 1 . Назначение и общая схема проведения дисперсионного анализа. Критерий F- Фишера

Цели и задачи изучения модульной единицы состоят в уяснении содержания дисперсионного анализа, алгоритма его проведения, используемых критериев.

    1. Назначение дисперсионного анализа

Дисперсионный анализ – это метод проверки гипотез относительно нескольких ( трех и более ) средних. Поскольку проводимые эксперименты в большинстве случаев носят многовариантный характер на основе дисперсионного анализа можно установить наличие или отсутствие различий между вариантами, а , следовательно, наличие или отсутствие связи между признаком , положенным в основу эксперимента и признаком на основе которого оцениваются его результаты. Поскольку и тот и другой признаки могут носить как качественный, так и количественный характер, дисперсионный анализ является незаменим инструментом для оценки взаимосвязи качественных признаков между собой, взаимосвязи качественных и количественных признаков.

    1. Общая схема проведения дисперсионного анализа. Критерий F- Фишера.

Общая схема проведения дисперсионного анализа соответствует общепринятой схеме проверки любой гипотезы.

На первом этапе выдвигаются две гипотезы. В качестве нулевой гипотезы выдвигается предположение , что все m генеральных средних равны между собой , то есть :Данная постановка нулевой гипотезы соответствует особенностям распределения используемых критериев, а также тому, что, как правило, исследователь изначально верит в то, что между вариантами различия присутствуют. В качестве альтернативной гипотезы выдвигается предположение, что хотя бы две генеральных средних не равны между собой ;:

В качестве основного критерия при дисперсионном анализе используется параметрический критерий F-Фишера. Параметрический критерий F-Фишера выдвигает два условия к выборкам , на основе которых он рассчитывается . Первое условие состоит в том , что распределения по выборкам должны соответствовать нормальному. Второе условие предполагает равенство дисперсий по выборкам.. Исследования в области дисперсионного анализа показали, что нарушение нормальности сказывается на возможности использования критерия F-Фишера лишь в том случае , если нарушается требование равенства дисперсий по выборкам. Особенно нежелательно использование критерия F-Фишера в том случае , если к отсутствию нормальности распределения, и равенства дисперсий добавляется неравенство численности выборок, при этом большей дисперсии соответствует меньшая численность выборки.

Фактическое значение критерия определяется по формуле

( при условии , что ). Если в ходе расчетов дисперсий оказалось , чтокритерийF-Фишера не рассчитывается , а сразу признается справедливой нулевая гипотеза о равенстве генеральных средних.. Такой вывод формируется исходя из следующих соображений. Источником межгрупповой дисперсии ( вспомним закон разложения вариации ) являются различия между средними. Если речь едет о постановке эксперимента, то источником межгрупповой вариации ( дисперсии ) является влияние фактора . Источником внутригрупповой вариации, а , следовательно, и дисперсии, является игра случая ( колеблемость признака внутри выборки ). Если , то это означает, что эффект фактора лежит в пределах игры случая, а , следовательно , различия между средними то же носят несущественный характер.

Для получения необходимых дисперсий вначале следует разложить общий объем вариации на составные части в соответствии с известным законом: . Поскольку речь идет о выборочных дисперсиях, для их получения необходимо соответствующие объемы вариации разделить на их степени свободы – для межгрупповой вариации :df () =m-1 , где m – число средних ;для внутригрупповой вариации df ()= (N-1)-(m-1), где N – общее число наблюдений по всем выборкам, то есть а. Как уже говорилось выше , далее следует сравнить полученные дисперсии на качественном уровне. Если внутригрупповая дисперсия оказалась больше или равной внутригрупповой следует сразу принять нулевую гипотезу о равенстве средних, если женадо рассчитать фактическое значение критерияF- Фишера и сравнить его с табличным . Табличное значение критерия зависит от уровня значимости и от степеней свободы df () =m-1 и df ()= (N-1)-(m-1), Сравнение фактического значения критерия с табличным позволяет сформулировать соответствующие выводы.

Вопросы для повторения

16-1.Каково назначение дисперсионного анализа ?

16-2. Каково содержание нулевой гипотезы при дисперсионном анализе ?

16-3. Каково содержание альтернативной гипотезы при дисперсионном анализе ?

16-4. Какой параметрический критерий используется при дисперсионном анализе ?

16-5. Какие дисперсии используются для расчета фактического значения критерия F –Фишера ?

16-6. В каком случае без расчета фактического значения критерия F –Фишера можно принять нулевую гипотезу?

16-7. От чего зависит табличное значение критерия F –Фишера ?

Резюме

В основе дисперсионного анализа лежит степень различий между средними по группам ( по вариантам опыта ). При одной степени эти различия следует отнести к игре случая, при другой они таковы, что к случайным их с большой долей вероятности отнести нельзя. Оценка степени этих различий производится на основе критерия F –Фишера

Модульная единица 2. Конкретизация результатов дисперсионного анализа. Модели дисперсионного анализа

Цель и задачи изучения этой модульной единицы состоят в освоении приемов., позволяющих с одной стороны привести дисперсионный анализ к его логическому завершению, а с другой , с учетом особенностей конкретной выборочной информации, внести в стандартную схему проведения дисперсионного анализа необходимые модификации