- •Стохастический факторный анализ (корреляционный анализ, дисперсионный анализ, регрессионный анализ)
- •Однофакторный дисперсионный анализ
- •Решение прикладных задач средствами excel. Инструменты пакета анализа в Microsoft Excel – Дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Понятие о двухфакторном дисперсионном анализе
Стохастический факторный анализ (корреляционный анализ, дисперсионный анализ, регрессионный анализ)
Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, для последующего планирования аналогичных экспериментов (а именно для выявления причинно-следственных связи между вариацией факторов и вариацией результативных признаков).
Среди факторов будем различать случайные и неслучайные величины, измеряемые в любой из шкал: интервальной, порядковой или номинальной.
Суть дисперсионного анализа состоит в разложении дисперсии признака на составляющие, обусловленные влиянием конкретных (контролируемых) факторов и остаточную дисперсию, объясняемую неконтролируемым влиянием или случайными обстоятельствами, и проверке гипотез о значимости их влияния.
Модели дисперсионного анализа будем классифицировать:
1) в зависимости от числа факторов на однофакторные, двухфакторные и т.д.;
2) по природе факторов на детерминированные (М1), случайные (М2) и смешанные, в зависимости от того какими являются уровни факторов.
Однофакторный дисперсионный анализ
Пусть имеются т партий изделий. Из каждой из которых отобрано соответственно изделий (для простоты пусть). Значения показателя качества этих изделий можно представить в виде матрицы наблюдений:
Следует проверить существенность влияния партии изделий на их количество. Положим, что элементы строк матрицы наблюдений – это численные значения (реализации) случайных величин , выражающих качество изделий и имеющих нормальный закон распределения с математическими ожиданиями соответственнои одинаковыми дисперсиями. Задача сводится к проверке нулевой гипотезы, осуществляемой в дисперсионном анализе.
Пусть усреднение по какому-либо индексу будет обозначено через «звездочку» (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня фактора примет вид:
(1)
а общая средняя –
(2)
Представим схему дисперсионного анализа в виде таблицы:
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
Межгрупповая |
m – 1 | ||
Внутригрупповая |
m·n – m | ||
Общая |
m·n – 1 |
– |
Справедливо следующее тождество: .
В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, являющиеся несмещенными оценками соответствующих дисперсий, которые получаются деление сумм квадратов отклонений на соответствующее число степеней свободы. {Для расчета среднего квадрата используютсят групповых средних, связанных одним уравнением (2), Поэтому число степеней свободы: . Для расчетаиспользуютсятn наблюдений, связанных между собой т уравнениями (1), – число степеней свободы: }.
Проверка нулевой гипотезы сводится к проверке существенности различия несмещенных выборочных оценок идисперсии.
Гипотеза Н0 отвергается, если фактически вычисленное значение статистики больше критического, определенного на уровне значимостиα при числе степеней свободы ,, и принимается, если.
Применительно к данной задаче опровержение гипотезы Н0 означает наличие существенных различий в качестве изделий различных партий на рассматриваемом уровне значимости.
Задача 1
При исследовании влияния стажа работы на производительность труда (количество деталей в день) в одном из цехов завода получен следующий однофакторный дисперсионный комплекс (таблица А1):
Таблица А1
Номер наблюдения |
Стаж работы рабочих (лет) | ||||||||||
|
До 5 |
5-10 |
10-15 |
15-20 | |||||||
1 |
155 |
154 |
153 |
164 | |||||||
2 |
153 |
158 |
162 |
162 | |||||||
3 |
149 |
157 |
164 |
163 | |||||||
4 |
150 |
161 |
163 |
| |||||||
5 |
|
|
167 |
| |||||||
|
ИТОГИ |
|
|
|
|
|
| ||||
|
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
|
| ||||
|
Столбец 1 |
4 |
607 |
151,75 |
7,583333333 |
|
| ||||
|
Столбец 2 |
4 |
630 |
157,5 |
8,333333333 |
|
| ||||
|
Столбец 3 |
5 |
809 |
161,8 |
27,7 |
|
| ||||
|
Столбец 4 |
3 |
489 |
163 |
1 |
|
| ||||
|
|
|
|
|
|
|
| ||||
|
|
|
|
|
|
|
| ||||
|
Дисперсионный анализ |
|
|
|
|
| |||||
|
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое | ||||
|
Между группами |
301,3875 |
3 |
100,4625 |
7,50887574 |
0,00432931 |
3,490294821 | ||||
|
Внутри групп |
160,55 |
12 |
13,37917 |
|
|
| ||||
|
|
|
|
|
|
|
| ||||
|
Итого |
461,9375 |
15 |
|
|
|
|
Х**=158,4375