- •Министерство образования российской федерации
- •С использованием табличного процессора Excel и надстройки «Пакет анализа»
- •Краткие теоретические сведения
- •Порядок выполнения работы
- •Пример выполнения
- •Содержание отчета
- •Пример построения гистограммы
- •Порядок выполнения работы
- •Контрольные вопросы
- •Пример расчета
- •Пример расчета
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Сравнение нескольких средних методом дисперсионного анализа
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Ковариация
- •Корреляция
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Пример расчета
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Библиографический список
- •394000, Воронеж, пр. Революции, 19
Сравнение нескольких средних методом дисперсионного анализа
Для проверки при заданном уровне значимости нулевой гипотезы о равенстве нескольких (p2) средних нормальных совокупностей с неизвестными, но одинаковыми дисперсиями достаточно проверить по критерию F нулевую гипотезу о равенстве факторной и остаточной дисперсий
, (3)
где sфакт2 – факторная дисперсия, характеризующая воздействие фактора F; sост2 – остаточная дисперсия, отражающая влияние случайных причин.
При использовании F-критерия строится правосторонняя критическая область (Fкрпр.; +), если Fр Fкр, то гипотезу отвергают.
Режим работы Однофакторный дисперсионный анализ служит для выяснения факта влияния контролируемого фактора F на результативный признак Y на основе выборочных данных.
В диалоговом окне данного режима (рис. 9) задаются следующие параметры:
Рис. 9
Входной интервал.
Группирование.
Метки в первой строке / Метки в первом столбце.
Альфа.
Выходной интервал / Новый рабочий лист / Новая рабочая книга.
Если в процессе анализа выявлено влияние фактора F на результативный признак Y, то можно измерить степень данного влияния с помощью выборочного коэффициента детерминации
, (4)
где sобщ2 – общая дисперсия, отражающая влияние и фактора и случайных причин.
Выборочный коэффициент детерминации показывает какая доля общей дисперсии объясняется зависимостью результативного признака Y от влияющего фактора F.
Пример
На рабочем листе Microsoft Excel сформированы выборочные данные о контроле показателя качества изделий, изготовленных на различных установках (табл. 13).
Таблица 13
|
B |
C |
D |
E |
F |
3 |
Показатель качества изделия | ||||
4 |
Номер измерения |
Установка 1 |
Установка 2 |
Установка 3 |
Установка 4 |
5 |
1 |
140 |
150 |
148 |
150 |
6 |
2 |
144 |
149 |
149 |
155 |
7 |
3 |
142 |
152 |
146 |
154 |
8 |
4 |
145 |
150 |
147 |
152 |
При уровне значимости =0,05 требуется выяснить, зависит ли показатель качества изделия от используемого оборудования.
Сначала проверим гипотезу о равенстве генеральных дисперсий H0: D(X1)=D(X2)=D(X3)=D(X4) по критерию Бартлетта, т.е. гипотезу об однородности дисперсий. Результаты расчетов показателей представлены в табл. 14.
Таблица 14
|
B |
C |
D |
E |
F |
10 |
Число наблюдений |
4 |
4 |
4 |
4 |
11 |
Оценки si2 |
4,917 |
1,583 |
1,667 |
4,917 |
12 |
Оценки s2 |
3,271 |
|
|
|
13 |
|
1,333 |
12,000 |
1,250 |
|
14 |
C |
1,139 |
|
|
|
15 |
|
-0,531 |
0,945 |
0,878 |
-0,531 |
16 |
B |
1,540 |
|
|
|
17 |
Bпркр, |
7,815 |
|
|
|
Формулы, содержащиеся в ячейках и используемые для вычислений, даны в табл. 15 (содержимое ячеек D10, E10, F10 аналогично C10; содержимое ячеек D11, E11, F11 аналогично C11).
Таблица 15
Ячейка |
Формула |
C11 |
=ДИСП(C5:C8) |
C12 |
=СУММ(C11*(C10-1);D11*(D10-1);E11*(E10-1);F11*(F10-1))/СУММ(C10-1;D10-1;E10-1;F10-1) |
C13 |
=СУММ(1/(C10-1);1/(D10-1);1/(E10-1);1/(F10-1)) |
D13 |
=СУММ(C10-1;D10-1;E10-1;F10-1) |
E13 |
=C13-1/D13 |
C14 |
=1+E13/(3*(4-1)) |
C15 |
=(C10-1)*LOG(C12/C11) |
C16 |
=2,303*(C15+D15+E15+F15)/C14 |
C17 |
=ХИ2ОБР(0,05;3) |
В ячейке С16 рассчитано значение правосторонней критической точки кр2 (; l-1).
Т.к. B=1,540 не попадает в критическую область (7,81; +), то гипотеза H0: D(X1)=D(X2)=D(X3)=D(X4) принимается и можно приступить к проверке гипотезы H0: M(X1)=M(X2)=M(X3)=M(X4).
Для решения задачи используем режим работы Однофакторный дисперсионный анализ со следующими значениями параметров: Входной интервал $C$4:$F$8; Группирование по столбцам; Метки в первой строке; Альфа 0,05; Выходной интервал $B$19.
Результаты расчета представлены в табл. 16 и 17.
Таблица 16
|
B |
C |
D |
E |
F |
19 |
Однофакторный дисперсионный анализ |
|
| ||
20 |
|
|
|
|
|
21 |
ИТОГИ |
|
|
|
|
22 |
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
23 |
Установка 1 |
4 |
571 |
142,75 |
4,92 |
24 |
Установка 2 |
4 |
601 |
150,25 |
1,58 |
25 |
Установка 3 |
4 |
590 |
147,5 |
1,67 |
26 |
Установка 4 |
4 |
611 |
152,75 |
4,92 |
Таблица 17
|
B |
C |
D |
E |
F |
G |
H |
29 |
Дисперсионный анализ | ||||||
30 |
Источник вариации |
SS |
df |
MS |
F |
P-значение |
F критическое |
31 |
Между группами |
220,19 |
3 |
73,40 |
22,44 |
3,28E-05 |
3,49 |
32 |
Внутри групп |
39,25 |
12 |
3,27 |
|
|
|
33 |
|
|
|
|
|
|
|
34 |
Итого |
259,44 |
15 |
|
|
|
|
Расчетное значение F-критерия Fр=22,44 (ячейка F31), а критическая область образуется правосторонним интервалом (3,49; +) (см. ячейку H31). Т.к. Fр попадает в критическую область, то гипотезу H0 о равенстве групповых математических ожиданий отвергаем и считаем, что показатель качества изделия зависит от работающей установки.
В таблице однофакторного дисперсионного анализа табл. 17 основные показатели рассчитаны следующим образом (табл. 18):
Таблица 18
Ячейка |
Показатель |
Формула | |
1 |
2 |
3 | |
С31 |
SS между группами |
факторная сумма квадратов отклонений групповых средних от общей средней |
|
С32 |
SS внутри групп |
остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней |
|
С33 |
SS итого |
общая сумма квадратов отклонений наблюдаемых значений от общей средней |
или
|
D31:D33 |
df |
степени свободы |
= 4 – 1 = 3 =16 – 4 = 12 = = n – 1 = 3 + 12 = 15 |
Окончание табл. 18
1 |
2 |
3 | |
E31:E32 |
MS |
несмещенные оценки дисперсий |
|
F31 |
F |
расчетное значение F-критерия |
|
G31 |
P-значение |
вероятность F-распределения |
=FРАСП(F31; D31; D32) |
H31 |
F критическое |
правосторонняя критическая точка |
=FРАСПОБР(0,05; D31; D 32) |
Выборочный коэффициент детерминации, равный
=0,85,
показывает, что 85 % общей выборочной вариации показателя качества изделия связано с применяемым оборудованием.