Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка Моделирование и оптимизация2012.doc
Скачиваний:
179
Добавлен:
28.03.2015
Размер:
5.59 Mб
Скачать

Практическое занятие № 4 Параметрические критерии проверки гипотез о средних и дисперсиях

Цель работы: проверить гипотезы о средних и дисперсиях с помощью параметрических критериев.

Критерий Фишера

Назначение. Проверка гипотезы о принадлежности двух дисперсий одной генеральной совокупности и следовательно — их равенстве.

Нулевая гипотеза. S22 = S12

Альтернативная гипотеза. Существуют следующие варианты НА в зависимости от которых различаются критические области:

1. S12 > S22. Наиболее часто используемый вариант НА. Критическая область — верхний хвост F-распределения.

2. S12 < S22. Критическая область — нижний хвост F-распределения. Ввиду частого отсутствия нижнего хвоста, в таблицах критическую область обычно сводят к варианту 1, меняя местами дисперсии.

3. Двухсторонняя S12 ≠S22 .Комбинация первых двух.

Предпосылки. Данные независимы и распределены по нормальному закону. Гипотеза о равенстве дисперсий двух нормальных генеральных совокупностей принимается, если отношение большей дисперсии к меньшей меньше критического значения распределения Фишера.

FP = S12/S22

Примечание. При описываемом способе проверки значение Fpaсч обязательно должно быть больше единицы. Критерий чувствителен к нарушению предположения о нормальности.

Для двухсторонней альтернативы S12 ≠S22 нулевая гипотеза принимается при выполнении условия:

F l-α/2 < Fрасч < Fα/2

Пример

Комплексным теплометрическим методом определяли теплофизические. характеристики (ТФХ) зеленого солода. Для приготовления образцов брали воздушно-сухой (средняя влажность W=19%) и влажный солод четырехсуточного ращения (W=45%) в соответствии новой технологией приготовления карамельного солода. Опыты показали, что теплопроводность λ влажного солода примерно в 2,5 раза больше, чем сухого, а объемная теплоемкость не имеет четкой зависимости от влажности солода. Поэтому с помощью F-критерия проверили возможность обобщить данные по средним значениям без учета влажности

Расчетные данные сведены в таблицу 5.1

Таблица 5.1

Данные к расчету F-критерия

Большее значение дисперсии получено для W=45%, т.е. S2 45 = S12, S2 19= S22, и FP = S12/S22=1,35. Из таблицы 5.2 для степени свободы f1=N1-1=5 f2=N2-1=4 при γ=0,95 определяем FКР=6,2. Нуль гипотеза сформулированная как «В диапазоне влажности зеленого солода от 19 до 45% ее влиянием на объемную теплоемкость можно пренебречь» или «S245 = S219» с доверительной вероятностью 95% подтвердилась, поскольку Fp<F.

Пример проверки гипотезы о принадлежности двух дисперсий одной генеральной совокупности по критерию Фишера с помощью Excel

Приведены данные по двум независимым выборкам (табл. 5.2) степени водопоглощения зерна пшеницы Было проведено исследование воздействия магнитными полями низкой частоты.

Таблица 5.2

Результаты исследований

Номер

Номер выборки

опыта

1

2 ,

1

0,027

0,075

2

0,036

0,4

3

0,1

0,08

4

0,12

0,105

5

0,32

0,075

6

0,45

0,12

7

0,049

0,06

8

0,105

0,075

Прежде, чем мы будем проверять гипотезу о равенстве средних этих выборок, необходимо проверить гипотезу о равенстве дисперсий, чтобы знать какой из критериев выбрать для ее проверки.

На рис. 5.1 приведен пример проверки гипотезы о принадлежности двух дисперсий одной генеральной совокупности по критерию Фишера используя программный продукт Microsoft Excel.

Рисунок 5.1 Пример проверки принадлежности двух дисперсий одной генеральной совокупности по критерию Фишера

Исходные данные размещены в ячейках, находящихся на пересечении столбцов С и D со строками 3-10. Выполним следующие действия.

1. Определим, можно ли считать закон распределения первой и второй выборок нормальным (столбцы С и D соответственно). Если нет (хотя бы для одной выборки), то необходимо использовать непараметрический критерий, если да – продолжаем.

2. Рассчитаем дисперсии для первого и вто­рого столбца. Для этого в ячейках СП и D11 поместим функции =ДИСП(СЗ:С10) и =ДИСП(DЗ:D10) соответственно. Результатом работы этих функций является рассчитанное значение дисперсии для каждого столбца соответственно.

3. Находим расчетное значение для критерия Фишера. Для этого нужно большую дисперсию разделить на меньшую. В ячейку F13 помещаем формулу =C11/D11, которая и выполняет эту операцию.

4. Определяем, можно ли принять гипотезу о равенстве дисперсий. Существует два способа, которые представлены в примере. По пер­вому способу, задавшись уровнем значимос­ти, например 0,05, вычисляют критическое значение распределения Фишера для этого значения и соответствующего числа степеней свободы. В ячейку F14 вводится функция =FPACПOBP(0,05;7;7) (где 0,05 - заданный уровень значимости; 7 — число степеней свободы числителя, а 7 (второе) — число степеней свободы знаменателя). Число степеней свободы равно числу экспериментов минус единица. Результат — 3,787051. Поскольку это значение больше расчетного 1,81144, мы должны принять нулевую гипотезу о равенстве дисперсий.

По второму варианту рассчитывают для полученного расчетного значения критерия Фишера соответствующую вероятность. Для этого в ячейку F15 вводится функ­ция =FPACП(F13;7;7). Поскольку полученное значение 0,22566 больше, чем 0,05, то принимается гипотеза о равенстве дисперсий.

Это может быть выполнено специальной функцией. Выберите в меню последовательно пункты Сервис, Анализ данных. Появится окно следующего вида (рис. 5.2).

Рисунок 5.2 Окно выбора метода обработки

В этом окне выбираете «Двухвыборочный F-mecm для дисперсий». В результате появится окно вида, показанного на рис. 5.3. Здесь задаются интервалы (номера ячеек) первой и второй переменной, уровень значимости (альфа) и место, где будет находится результат.

Задавайте все необходимые параметры и нажимайте ОК. Результат работы приведен на рис. 5.4

Следует отметить, что функция проверяет односторонний критерий и делает это правильно. Для случая, когда критериальное значение больше 1, вычисляется верхнее критическое значение.

Рисунок 5.3 Окно задания параметров

Когда критериальное значение меньше 1, то вычисляется нижнее критическое.

Напоминаем, что гипотеза о равенстве дисперсий отвергается, если критериальное значение больше врехнего критического или меньше нижнего.

Рисунок 5.4 Проверка равенства дисперсий

Критерий Кохрена

Проверка гипотезы о принадлежности нескольких дисперсий к одной генеральной совокупности.

Нулевая гипотеза σ12 = σ22 = σi2= σk2 = σ2 .

Данные независимы и распределены по нормальному закону. Количество наблюдений одинаково в каждой выборке.

Пример решения этой задачи с помощью электронных таблиц Microsoft Excel.

При исследовании комбинированного действия компонентов комплексной добавки на содержание углеводов в продукте было проведено 9 экспериментов (по 3 раза каждый). Необходимо проверить, можно ли считать дисперсии во всех 9 экспериментах однородными. Если они таковыми не являются, это означает, что рассеяние зависит от дозировок каких-либо из изучаемых компонентов или имеются грубые ошибки в результатах наблюдений, связанные, например, с некачественными реактивами и пр. Результаты экспериментов приведены в табл. 5.3.

Таблица 5.3

Результаты экспериментов

Номер

Содержание углеводов, %

опыта

Номер серии

1

2

3

1

30,2

43,6

56

2

4

1

3,5

3

3,5

2,7

3,5

4

31,5

28,7

30,1

5

13,6

16,1

21,1

6

56

28,7

36,2

7

16,1

16,1

28,7

8

11,1

16,1

13,6

9

26,1

35,2

16

В столбиках С, D, Е (строках 2-10) находятся исходные данные. Для выполнения анализа однородности по Кохрену необходимо выполнить следующие операции.

1. Определить, можно ли считать закон распределения каждой выборки нормальным.

Если нет (хотя бы для одной выборки), то следует использовать непараметрический критерий, если да — продолжать.

В столбике G (строках 2-10) рассчитать дисперсии по каждому опыту. Для этого необходимо в ячейках G2-G10 поместить функции расчета дисперсии: в G2 — =ДИСП(С2:Е2), в G3 — =ДИСП(СЗ:ЕЗ) и т. д. Результатом будет столбик дисперсий по каждой строке.

3. Найти максимальную из дисперсий. В ячейке G12 помещаем функцию =MAKC(G2:G10).

4. Найти сумму дисперсий. В ячейке G13 помещаем функцию =CyMM(G2:G10).

5. Найти расчетное значение критерия Кохрена для чего в ячейке G14 помещаем следующую формулу =G12/G13.

Результаты работы приведены на рисунке 5.5

Рисунок 5.5 Пример проверки однородности дисперсий с помощью критерия Кохрена

Таким образом, мы нашли расчетное значение критерия Кохрена — 0,379118. Теперь для проверки гипотезы его необходимо сравнить с табличным. Для этого надо получить значение соответствующей точки распределения Кохрена. Такой функции в Excel нет, но известно, что распределение Кохрена можно аппроксимировать распределением Фишера. При этом распределения связаны соотношением

Для вычисления требуемого нам критического значения поместим в столбец К значения числа выборок (строка 4), размера выборки (строка 5), уровня значимости (строка 6). В строках 9-11 помещены формулы для расчета критической точки распределения:

К9 - =К6/(К5-1);

К10 - =FPACПOBP(K9;K4;(K5-l-l)*K4);

К11 - -К10ДК10+К5-1-1).

В ячейке Kl1 и будет располагаться искомое значение критической точки распределения Кохрена. В данном случае — 0,437701. Поскольку оно больше расчетного, то гипотеза об однородности выборок принимается.

Проверка гипотезы о равенстве средних при неравных дисперсиях выборок

Рассматривается исследование влияния пребиотической добавки на лабораторных крыс (см. рис. 3.16). В ячейках С2:С11 — масса животных контрольной группы, а в ячейках D2: D10 — животные опытной группы.

Сначала определим, можно ли считать закон распределения первой и второй выборок нормальным. Если нет (хотя бы для одной выборки), то необходимо использовать непараметрический критерий, если да — продолжим.

Вычислим средние значения. Для это­го в ячейку С12 (D12) помещаем функ­цию = СРЗНАЧ(С2:С11) (для D11 -=CP3HAЧ(D2:D10). Затем вычисляем дисперсии этих выборок, для этого в ячейку С13 (D13) помещаем функцию =ДИСП(С2:С11) (для D13 - =ДИСП(D2: D10). Далее проверяем гипотезу о равенстве дисперсий, для чего рассчитывается значение критерия Фишера (с помощью формулы =C13/D13, помещенной в ячейку Е14). Затем определяется критическое значение вызовом в ячейке Е15 функции =FPACПOBP(0,05;9;8). Здесь 0,05 — уровень значимости, а 9 и 8 – степени свободы дисперсий в числителе (10-1) и в знаменателе (9-1) соотвественно.

Поскольку расчетное значение больше критического (4,27659 > 3,388124), то гипотеза о равенстве дисперсий отвергается в пользу гипотезы о том, что дисперсия первой выборки больше дисперсии второй.

Поскольку мы выяснили, что дисперсии выборок неравны, то для проверки гипотезы о равенстве средних как раз подходит этот критерий.

Осталось задать формулы для вычисления расчетного значения t-критерия и числа степеней свободы. Формула для вычисления расчетного значения t-критерия помещена в ячейку 17 и выглядит так: =(D12-C12)/ KOPEHЬ(C13/10+D13/9)). Здесь числа 10 и 9 — размеры первой и второй выборок. Мы получили значение 1,574214. Теперь необходимо рассчитать значение числа степеней свободы. В ячейке Н7 мы помещаем соответствующую формулу:

=(C13/10+D13/9)*(C13/10+Dl3/9)/((C13/ 10)*(C13/10)/11+(D13/9)*(Dl3/9)/10)-2.

Здесь числа 11 и 10 — это увеличенные на единицу размеры выборок, а 10 и 9 — собственно размеры первой и второй выборок соответственно. В данном случае расчетное значение может быть дробным. Затем мы вычисляем критическое значение для распределения Стыодента: в ячейку Н9 помещаем вызов функции =СТЪЮДРАСПОБР(0,025; Н7), где 0,025 — α/2 при 5% уровне значимости, Н7 — адрес ячейки, в которой находится рассчитанное значение числа степеней свободы. Поскольку 1,574214 < 2,509569, гипотеза о равенстве средних принимается. Иллюстрирует пример рис. 5.6.

Рисунок 5.6 Пример проверки гипотезы о равенстве средних при неравных дисперсиях

Рассмотрим, как решается такая задача непосредственно специальными средствами Excel. Предварительно нужно выяснить одинаковые дисперсии или нет. Допустим, они статистически значимо различаются. Выберите в меню последовательно пункты Сервис, Анализ данных. Появится окно следующего вида (рис. 5.7).

Рисунок 5.7 Окно выбора обработки

В этом окне выбираете пункт «Двухвыборочный t-тест» с различными дисперсиями». В результате появится окно вида, показанного на рис. 5.8.

Рисунок 5.8 Окно задания исходных данных для проверки равенства средних при неравных дисперсиях

Здесь задаются интервалы (номера ячеек) первой и второй переменной, уровень значимости (альфа) и место, где будет находиться результат. Результат работы приведен на рис. 5.9. При задании «Гипотетической средней разницы» будет проверяться гипотеза о том, что разница средних значений равна указанной вами величине.

Рисунок 5.9 Исходные данные и результат теста по проверке равенства средних при различных дисперсиях

Проверка гипотезы о равенстве среднего заданному значению А

Проверка равенства среднего определенному значению.

Выборки извлечены из совокупности, имеющей нормальное распределение, данные независимы.

Критериальное значение вычисляется по формуле:

где N — размер выборки;

S2 — эмпирическая дисперсия выборки;

А — предполагаемая величина среднего значения;

X— среднее значение.

Число степеней свободы для t-критерия V = n-1.

Нулевая гипотеза

Н0: X = А против НА: X≠А. Нулевая гипотеза о равенстве средних отвергается, если по абсолютной величине критериальное значение больше верхней α/2 % точки t-распределения взятого с V степенями свободы, то есть при │t│> tvα/2.

Н0: Х< А против НА: X > А. Нулевая гипотеза отвергается, если критериальное значение больше верхней α% точки t-распределения взятого с V степенями свободы, то есть при │t│> t.

Н0: Х>А против HА: X < А. Нулевая гипотеза отвергается, если критериальное значение меньше нижней α% точки t-распределения, взятого с V степенями свободы.

Критерий устойчив при малых отклонениях от нормального распределения.

Пример

Рассмотрим пример, представленный на рис. 5.10. Допустим, что нам необходимо проверить гипотезу о равенстве среднего для выборки (ячейки 123:130) величине 0,012.

Сначала находим среднее выборки (=СРЗНАЧ(123:130) в I31) и дисперсию (=ДИСП(I23:I30) в I32). После этого рассчитываем критериальное (=(131-0,012)*КОРЕНЬ(133)/132) и критическое (=СТЬЮДРАСПОБР(0,025;133-1)) значения. Поскольку критериальное значение (24,64) больше критического (2,84), то гипотеза о равенстве среднего 0,012 отвергается.

Рисунок 5.10 Сравнение среднего значения с константой

Задание

1. проверить гипотезы о средних и дисперсиях с помощью параметрических критериев Фишера и Кохрена (таблица 5.4);

2. проверить гипотезу о равенстве средних при неравных дисперсиях выборок (для этого в одной из выборок своего варианта убрать 1 или 2 значения) (таблица 5.4);

3. проверить гипотезу о равенстве среднего заданному значению А (таблица 5.5) и данные из 1-го столбца по варианту.

Таблица 5.4

Варианты заданий

Данные эксперимента

Вариант

1

2

3

4

5

2,3

2,6

28

23

2,2

2,1

30

22

2,5

2,6

1,20

1,42

17,3

23,5

2,37

2,85

35,2

26,1

2,1

2,6

5,63

5,62

26,1

27,0

5,67

2,67

35,9

25,8

5,1

5,63

2,34

2,37

23,9

23,3

2,35

2,34

33,6

23,8

2,34

2,38

7,71

7,90

28,0

25,2

2,59

2,58

35,7

26,0

7,63

7,6,1

1,2

1,6

29

28

1,7

2,6

38

29

1,9

2,8

1,13

1,15

21,6

21,2

2,13

2,16

31,7

28

1,12

1,12

1,45

1,47

24,7

24,8

2,45

2,47

34,8

24,5

1,49

1,45

3,57

3,59

25,9

25,7

2,55

2,59

36,0

25,7

3,58

3,58

3,3

3,6

26

27

2,5

2,4

37

29

3,4

3,5

Данные эксперимента

Вариант

6

7

8

9

10

7,3

7,6

286

230

12,2

12,1

70

62

3,5

4,6

6,20

6,42

217,3

230,5

12,37

12,85

75,2

86,1

3,1

4,6

7,63

5,62

264,1

278,0

15,67

14,67

75,9

75,8

5,1

5,63

6,34

5,37

233,9

236,3

12,35

12,34

73,6

73,8

3,34

4,38

7,71

7,90

281,0

255,2

12,59

12,58

85,7

86,0

3,63

4,6,1

6,2

6,6

296

287

11,7

12,6

88

79

3,9

4,8

4,13

4,15

251,6

261,2

12,13

12,16

71,7

78

5,12

4,12

5,45

6,47

244,7

247,8

12,45

12,47

74,8

84,5

3,49

4,45

5,57

5,59

250,9

255,7

12,55

12,59

86,0

85,7

3,58

3,58

5,3

5,6

263

270

12,5

12,4

87

79

3,4

3,5

Таблица 5.5

Значение А

Варианты

1

2

3

4

5

6

7

8

9

10

2,2

24

2,2

31

2,2

6,5

250

12,2

76

3,5

В качестве исходных данных в задании можете использовать свои экспериментальные данные.

Отчет должен содержать расчеты статистических характеристик.

Контрольные вопросы:

  1. Какие статистические задачи решаются при исследовании технологических процессов производства пищевой промышленности?

  2. Каким образом сравниваются статистические характеристики случайных величин?

  3. Уровень значимости и доверительная вероятность при достоверности оценки экспериментальных данных.

  4. Как осуществляется проверка статистических гипотез с помощью критериев согласия?

  5. От чего зависит мощность критерия согласия для анализа экспериментальных выборок?

  6. Каким образом осуществояется подбор критерия для решения задач анализа технологических процессов производства пищевых продуктов?

  7. Каким образом осуществляется классификация критериев согласия для анализа выборок результатов исследований технологических процессов производства пищевых продуктов?

  8. Какие требования предъявляются к выборкам резльтатов исследований технологических процессов производства пищевых продуктов?