Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Stat_metod.doc
Скачиваний:
7
Добавлен:
10.09.2019
Размер:
4.6 Mб
Скачать

18. Однофакторный дисперсионный анализ

Содержание темы

Сравнение нескольких средних. Понятие о дисперсионном анализе. Факторная и остаточная дисперсии. Критерий Фишера. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы. Критерий Кочрена.

Сравнение нескольких средних

Пусть генеральные совокупности Х1, Х2, ..., Хр распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу Н01) = М2) = ... =M(Xp) о равенстве всех математических ожиданий. Другими словами, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних > 2) можно сравнить их попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта. По этой причине для сравнения нескольких средних пользуются другим методом, который основан на сравнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером).

На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F на изучаемую величину X. Конкретная реализация фактора, например, применяемая ставка таможенной пошлины, называется уровнем фактора. В дисперсионном анализе изучается влияние факторов, имеющих ограниченное число уровней.

Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.

Критерий Фишера

Пусть количественные признаки X и Y распределены нормально. По независимым выборкам из первой и второй совокупностей с объемами, соответственно равными nX и nY, найдены исправленные дисперсии и . Требуется проверить при заданном уровне значимости по исправленным дисперсиям и гипотезу, заключающуюся в том, что генеральные дисперсии равны между собой:

.

Для определенности будем считать, что > . В качестве критерия проверки гипотезы используют отношение большей исправленной дисперсии к меньшей, т.е. величину

.

Найдем критическую точку по таблице Приложения 3

Если , то гипотеза о равенстве дисперсий принимается;

Если , то принимается альтернативная гипотеза: .

Дисперсионный анализ

В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ).

Мы ограничимся простейшим случаем однофакторного анализа, когда на X воздействует только один фактор, который имеет р постоянных уровней F1, F2,..., Fp.

Пусть на количественный нормально распределенный признак X воздействует фактор F, который имеет р постоянных уровней. Будем предполагать, что число наблюдений на каждом уровне одинаково и равно q. Пусть наблюдалось n — pq значений Хij признака, где i — номер испытания (i — 1, 2, ..., q), j—номер уровня (j=1, 2, ...,р). Рассмотрим факторную группировку.

Номер

наблюдения

Уровни фактора F ,

F1

F2

Fp

1

X11

X12

X1p

2

X21

X22

X2p

q

Xq1

Xq2

Xqp

Введем, факторную и остаточную дисперсии.

Факторная дисперсия характеризует рассеяние между группами.

Остаточная дисперсия характеризует рассеяние «внутри групп».

, где .

Убедимся, что sфакт характеризует воздействие фактора F. Допустим, что фактор оказывает существенное влияние на X. Тогда группа наблюдаемых значений признака на одном определенном уровне, вообще говоря, отличается от групп наблюдений на других уровнях. Следовательно, различаются и групповые средние, причем они тем больше рассеяны вокруг общей средней, чем большим окажется воздействие фактора. Отсюда следует, что для оценки воздействия фактора целесообразно составить сумму квадратов отклонений групповых средних от общей средней (отклонение возводят в квадрат, чтобы исключить погашение положительных и отрицательных отклонений). Итак, sфакт характеризует воздействие фактора.

Убедимся, что sОСТ отражает влияние случайных причин. Казалось бы, наблюдения одной группы не должны различаться. Однако, поскольку на X, кроме фактора F, воздействуют и случайные причины наблюдения одной и той же группы, вообще говоря, различны и значит, рассеяны вокруг своей групповой средней. Отсюда следует, что для оценки влияния случайных причин целесообразно составить сумму квадратов отклонений наблюдаемых значений каждой группы от своей групповой средней. Итак, sОСТ характеризует воздействие случайных причин.

Пусть нулевая гипотеза о равенстве групповых средних ложна. В этом случае с возрастанием расхожде­ния между групповыми средними увеличивается фактор­ная дисперсия, а вместе с ней и отношение В итоге Fнабл окажется больше Fкр( ) и, следовательно, гипотеза о равенстве дисперсий будет отвергнута.

Таким образом, если гипотеза о равенстве групповых средних ложна, то ложна и гипотеза о равенстве факторной и остаточной дисперсий. Для того чтобы проверить нулевую гипотезу о равенстве групповых средних нормальных совокупностей с одинаковыми дисперсиями, достаточно проверить по критерию Фишера F нулевую гипотезу о равенстве факторной и остаточной дисперсий. В этом и состоит метод дисперсионного анализа.

После того, как установлено то, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производят попарное сравнение средних. Как правило, приходится иметь дело с малыми выборками. В этом случае используют

Критерий Стьюдента

Итак, пусть количественные признаки X и Y распределены нормально, и их дисперсии одинаковы и неизвестны. Требуется проверить нулевую гипотезу:

.

При этом конкурирующей гипотезой является гипотеза:

Другими словами, требуется установить, значимо или незначимо выборочное среднее больше выборочного среднего ( и найдены по двум независимым выборкам объемов n и m ).

В качестве критерия проверки нулевой гипотезы принимаем случайную величину

.

Если , то нет оснований отвергнуть нулевую гипотезу; - критическая точка распределения Стьюдента, где - уровень значимости (односторонняя критическая область), n+m-2 - число степеней свободы.

Если , то принимают конкурирующую гипотезу.

Если при проведении дисперсионного анализа нет уверенности в справедливости предположения о равенстве дисперсий исследуемого признака на каждом уровне фактора, то это предположение проверяют с помощью критерия Кочрена.

Сравнение нескольких дисперсий

Пусть признаки Х1, Х2, ..., Хр распределены нормально. Требуется при заданном уровне значимости по выборочным исправленным дисперсиям проверить нулевую гипотезу Н0:D1) = D2) = ... =D(Xp) о равенстве всех дисперсий. Другими словами, требуется установить, значимо или незначимо различаются выборочные дисперсии. Пусть объем каждой выборки равен n.

В качестве критерия проверки нулевой гипотезы примем критерий Кочрена G - отношение максимальной исправленной дисперсии к сумме всех исправленных дисперсий

.

Если , то нет оснований отвергнуть гипотезу о равенстве дисперсий, где - критическая точка распределения Кочрена (приложение 4), - уровень значимости, n-1 - число степеней свободы, p - количество выборок. Если , то гипотезу отвергают.

Пример. Установить с уровнем значимости 5% факт влияния ставки таможенной пошлины на объем экспорта продукции в стоимостном выражении (тыс. долл.).

 

Значение ставки пошлины

Номер наблюдения

5%

10%

15%

1

30

18

13

2

33

23

18

3

27

25

17

4

26

22

16

5

25

24

13

6

32

25

15

7

30

21

10

Решение. Вычислим групповые средние и исправленные дисперсии S2j.

 

Значение ставки пошлины

Показатель

5%

10%

15%

Средние,

29,00

22,57

14,57

Исправленные дисперсии, S2j

9,33

6,29

7,62

Чтобы воспользоваться дисперсионным анализом необходимо проверить гипотезу о равенстве дисперсий. Воспользуемся критерием Кочрена. Критическая точка распределения Кочрена =0,6771, S2max=9.33, а критерий Кочрена G=0.4. Поскольку , гипотеза о равенстве дисперсий принимается.

Вычислим факторную и остаточную дисперсии , , а также критерий Фишера . По таблице для уровня значимости 5% находим критическую точку Фишера Fкр( )=3.55. Поскольку Fнабл >Fкр( ), гипотеза о влиянии фактора принимается c уровнем значимости 5%.

Вывод Изменение таможенной пошлины влияет на стоимостные объемы экспорта данной продукции.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]