Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 курс АФК / лабораторная_ проверка статистичеких гипотез.docx
Скачиваний:
80
Добавлен:
22.03.2015
Размер:
103.54 Кб
Скачать

Тест на равенство двух дисперсий. (Критерий Ливиня)

Дисперсионный анализ - достаточно большой раздел статистики. Здесь мы не будем останавливаться на нем подробно, а лишь в общих чертах опишем F-критерий, который используется для проверки гипотезы о равенстве дисперсий. Он вычисляется по следующей формуле:

где - большая выборочная дисперсия, а- меньшая, арассчитывается так:.

Проверяемая (нулевая) гипотеза: сравниваемые выборочные дисперсии характеризуют вариацию признака в совокупностях, взятых из нормально распределенных генеральных совокупностей с одинаковыми дисперсиями ().

Для того чтобы отвергнуть или принять проверяемую нами гипотезу, мы пользуемся F-распределением Фишера и соответствующими таблицами. В этих таблицах указываются предельные значения F-критерия для различных комбинаций числа степеней свободы числителя и знаменателя, которые могут быть превзойдены с вероятностью 0,05 или 0,01. Число степеней свободы , соответствующее большей дисперсии (), определяет столбец таблицы, число степеней свободы(), соответствующее дисперсии, строку таблицы (см. приложение: таблица №1).

Рассчитанная по фактическим данным величина дисперсионного отношения сопоставляется с соответствующей данному сочетанию числа степеней свободы числителя и знаменателя и принятому уровню значимости табличной величиной дисперсионного отношения.

Если фактическое дисперсионное отношение будет больше табличного, то лишь с вероятностью 0,05 или 0,01 можно утверждать, что различие между дисперсиями определяется случайными факторами. Иными словами, при фактическом F-критерии превышающем табличный мы отвергаем нулевую гипотезу и считаем, что выборочные дисперсии взяты из генеральных совокупностей с различными дисперсиями.

Допустим, а. Тогда, апри уровне значимости. Значит, мы принимаем нулевую гипотезу и считаем дисперсии равными, так как. То есть, несмотря на видимое различие междуи, статистически это различие не значимо.

Выбор критерия

На основе сказанного в пунктах 2 и 3, мы выбираем критерий для проверки выдвинутой нами гипотезы. Вернемся опять к нашим примерам (см. таблицу №1). Для проверки гипотезы из первого примера мы воспользуемся t-критерием (каким именно t-критерием, мы здесь считать не будем), для проверки гипотезы из третьего примера мы воспользуемся z-критерием для независимых выборок, для проверки гипотезы из второго примера мы воспользуемся z-критерием для парных выборок.

Уровень значимости и определение области допустимых значений

Уровень значимости - вероятность ошибочно отвергнуть основную проверяемую гипотезу, когда она верна. В социологии обычно используется уровень значимости ,,. Критическую область для любого уровня значимости можно найти в таблице: если мы пользуемся z-критерием, то это будет таблица для стандартизированного нормального распределения (см. приложение: таблица №2), если мы пользуемся t-критерием, то это будет таблица для распределения Стьюдента (см. приложение: таблица №3). Приведем более конкретный пример - для начала поговорим о нормальном распределении, а потом о распределении Стьюдента.

Нормальное распределение.Возьмем уровень значимости . На графике критическая область будет выглядеть следующим образом.

Рисунок 2

Из рис.2 мы видим, что область допустимых значений для уровня значимости 0,05 будет находиться от -1,96 до +1,96. То есть если значение, полученное по формуле z-критерия, попадет в промежуток от -1,96 до +1,96, мы принимаем нулевую гипотезу, если нет - отвергаем. Также мы видим, что область <ошибочного принятия верной гипотезы> (хвосты распределения больше +1,96 и меньше -1,96) разделена на две части. Это говорит о том, что критерий двусторонний. Такой критерий обычно используется, когда мы проверяем двустороннюю гипотезу. Если же мы имеем дело с односторонней гипотезой, () то следует использовать односторонний критерий. Графически это выглядит следующим образом:

Рисунок 3

Чтобы найти значение критической точки для рис.3 в таблице стандартизированного нормального распределения, надо пользоваться уровнем значимости . Соответственно, если, например, мы хотим узнать критическую точку для одностороннего критерия при уровне значимости 0,01, мы должны искать в таблице критическую точку для уровня значимости 0,02 (она будет равна 2,33) и т.д.

Распределение Стьюдента. Итак, когда мы применяем t-критерий, то пользуемся распределением Стьюдента. Значение критической точки распределения Стьюдента зависит не только от выбранного нами уровня значимости, но также, как было уже отмечено выше, от числа степеней свободы, обычно обозначаемого df. Формула, по которой можно определить число степеней свободы для конкретных двух независимых выборок выглядит следующим образом: гдеиобъем первой и второй выборок соответственно.

Допустим число степеней свободы у нас равно 9. Тогда для уровня значимости 0,05 графически критическая область будет выглядеть, как показано ниже:

Рисунок 4

Из рис.4 мы видим, что область допустимых значений для уровня значимости 0,05 в данном случае будет находиться от -2,26 до +2,26. То есть если значение, полученное по формуле t-критерия, попадет в промежуток от -2,26 до +2,26, мы принимаем нулевую гипотезу, если нет - отвергаем.

Если мы хотим построить график для одностороннего уровня значимости, следует действовать по той же схеме, что и для нормального распределения.

Итак, для того, чтобы определить критическую точку нам надо, прежде всего, задать уровень значимости или вероятность отвергнуть нулевую гипотезу, когда она верна. Если мы отвергаем верную гипотезу, то совершаем ошибку. Но мы также можем совершить и другую ошибку: принять неверную гипотезу. Такого рода ошибки называются ошибками первого и второго рода соответственно.

Проверка любой гипотезы может иметь четыре исхода, которые обычно представляют в виде следующей таблицы:

Таблица №3.

 

Нулевая гипотеза верна

Нулевая гипотеза ложна

Нулевая гипотеза не отвергается

Правильное решение

Ошибка второго рода

Нулевая гипотеза отвергается

Ошибка первого рода

Правильное решение

Таким образом, нельзя сказать, что чем меньше мы возьмем уровень значимости , тем более вероятно правильное решение и тем меньше возможность ошибиться. Если мы зададим максимально маленький уровень значимости, то практически исключим вероятность ошибки первого рода, но не ошибки второго рода.

Достаточно сложно определить вероятность совершения ошибки второго рода, обозначаемой греческой буквой . Вероятность не отвергнуть ложную гипотезу зависит от многих факторов, включая следующие:

1.      истинного значения изучаемого параметра, то есть того, которое мы получили бы, опросив всю генеральную совокупность;

2.      величины уровня значимости ;

3.      от того, односторонний или двусторонний у нас критерий;

4.      от дисперсии генеральной совокупности;

5.      от объема нашей выборки.

Очевидно, что истинного значения изучаемого параметра мы никогда не знаем (иначе зачем бы мы проводили исследование) да и знание дисперсии генеральной совокупности случай не такой уж частый. Поэтому мы посчитать не можем. Но зато можем постараться снизить вероятность ошибки второго рода, зная некоторые ее свойства.

Вероятность совершить ошибку второго рода будет уменьшаться:

1.      с увеличением разницы между истинным и гипотетическим (тем, которое мы получили) параметрами;

2.      с увеличением уровня значимости ;

3.      с увеличением размера выборки;

4.      с уменьшением стандартного отклонения от среднего генеральной совокупности.