Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие программные стат комплексы.doc
Скачиваний:
36
Добавлен:
14.03.2016
Размер:
1.32 Mб
Скачать

Сравнение нескольких средних методом дисперсионного анализа

Для проверки при заданном уровне значимости нулевой гипотезы о равенстве нескольких (p2) средних нормальных совокупностей с неизвестными, но одинаковыми дисперсиями достаточно проверить по критерию F нулевую гипотезу о равенстве факторной и остаточной дисперсий

, (3)

где sфакт2 – факторная дисперсия, характеризующая воздействие фактора F; sост2 – остаточная дисперсия, отражающая влияние случайных причин.

При использовании F-критерия строится правосторонняя критическая область (Fкрпр.; +), если FрFкр, то гипотезу отвергают.

Режим работы Однофакторный дисперсионный анализ служит для выяснения факта влияния контролируемого фактора F на результативный признак Y на основе выборочных данных.

В диалоговом окне данного режима (рис. 9) задаются следующие параметры:

Рис. 9

  1. Входной интервал.

  2. Группирование.

  3. Метки в первой строке / Метки в первом столбце.

  4. Альфа.

  5. Выходной интервал / Новый рабочий лист / Новая рабочая книга.

Если в процессе анализа выявлено влияние фактора F на результативный признак Y, то можно измерить степень данного влияния с помощью выборочного коэффициента детерминации

, (4)

где sобщ2 – общая дисперсия, отражающая влияние и фактора и случайных причин.

Выборочный коэффициент детерминации показывает какая доля общей дисперсии объясняется зависимостью результативного признака Y от влияющего фактора F.

Пример

На рабочем листе Microsoft Excel сформированы выборочные данные о контроле показателя качества изделий, изготовленных на различных установках (табл. 13).

Таблица 13

B

C

D

E

F

3

Показатель качества изделия

4

Номер измерения

Установка 1

Установка 2

Установка 3

Установка 4

5

1

140

150

148

150

6

2

144

149

149

155

7

3

142

152

146

154

8

4

145

150

147

152

При уровне значимости =0,05 требуется выяснить, зависит ли показатель качества изделия от используемого оборудования.

Сначала проверим гипотезу о равенстве генеральных дисперсий H0: D(X1)=D(X2)=D(X3)=D(X4) по критерию Бартлетта, т.е. гипотезу об однородности дисперсий. Результаты расчетов показателей представлены в табл. 14.

Таблица 14

B

C

D

E

F

10

Число наблюдений

4

4

4

4

11

Оценки si2

4,917

1,583

1,667

4,917

12

Оценки s2

3,271

13

1,333

12,000

1,250

14

C

1,139

15

-0,531

0,945

0,878

-0,531

16

B

1,540

17

Bпркр,

7,815

Формулы, содержащиеся в ячейках и используемые для вычислений, даны в табл. 15 (содержимое ячеек D10, E10, F10 аналогично C10; содержимое ячеек D11, E11, F11 аналогично C11).

Таблица 15

Ячейка

Формула

C11

=ДИСП(C5:C8)

C12

=СУММ(C11*(C10-1);D11*(D10-1);E11*(E10-1);F11*(F10-1))/СУММ(C10-1;D10-1;E10-1;F10-1)

C13

=СУММ(1/(C10-1);1/(D10-1);1/(E10-1);1/(F10-1))

D13

=СУММ(C10-1;D10-1;E10-1;F10-1)

E13

=C13-1/D13

C14

=1+E13/(3*(4-1))

C15

=(C10-1)*LOG(C12/C11)

C16

=2,303*(C15+D15+E15+F15)/C14

C17

=ХИ2ОБР(0,05;3)

В ячейке С16 рассчитано значение правосторонней критической точки кр2 (; l-1).

Т.к. B=1,540 не попадает в критическую область (7,81; +), то гипотеза H0: D(X1)=D(X2)=D(X3)=D(X4) принимается и можно приступить к проверке гипотезы H0: M(X1)=M(X2)=M(X3)=M(X4).

Для решения задачи используем режим работы Однофакторный дисперсионный анализ со следующими значениями параметров: Входной интервал $C$4:$F$8; Группирование по столбцам; Метки в первой строке; Альфа 0,05; Выходной интервал $B$19.

Результаты расчета представлены в табл. 16 и 17.

Таблица 16

B

C

D

E

F

19

Однофакторный дисперсионный анализ

20

21

ИТОГИ

22

Группы

Счет

Сумма

Среднее

Дисперсия

23

Установка 1

4

571

142,75

4,92

24

Установка 2

4

601

150,25

1,58

25

Установка 3

4

590

147,5

1,67

26

Установка 4

4

611

152,75

4,92

Таблица 17

B

C

D

E

F

G

H

29

Дисперсионный анализ

30

Источник вариации

SS

df

MS

F

P-значение

F критическое

31

Между группами

220,19

3

73,40

22,44

3,28E-05

3,49

32

Внутри групп

39,25

12

3,27

33

34

Итого

259,44

15

Расчетное значение F-критерия Fр=22,44 (ячейка F31), а критическая область образуется правосторонним интервалом (3,49; +) (см. ячейку H31). Т.к. Fр попадает в критическую область, то гипотезу H0 о равенстве групповых математических ожиданий отвергаем и считаем, что показатель качества изделия зависит от работающей установки.

В таблице однофакторного дисперсионного анализа табл. 17 основные показатели рассчитаны следующим образом (табл. 18):

Таблица 18

Ячейка

Показатель

Формула

1

2

3

С31

SS

между группами

факторная сумма квадратов отклонений групповых средних от общей средней

С32

SS

внутри групп

остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней

С33

SS

итого

общая сумма квадратов отклонений наблюдаемых значений от общей средней

или

D31:D33

df

степени свободы

= 4 – 1 = 3

=16 – 4 = 12

=

= n – 1 = 3 + 12 = 15

Окончание табл. 18

1

2

3

E31:E32

MS

несмещенные оценки дисперсий

F31

F

расчетное значение F-критерия

G31

P-значение

вероятность F-распределения

=FРАСП(F31; D31; D32)

H31

F критическое

правосторонняя критическая точка

=FРАСПОБР(0,05; D31; D 32)

Выборочный коэффициент детерминации, равный

=0,85,

показывает, что 85 % общей выборочной вариации показателя качества изделия связано с применяемым оборудованием.