- •§ 3. Классификация по одному признаку §3. Классификация по одному признаку
- •3.1. Введение. Типы факторов
- •3.2. Классификация по одному признаку с разным количеством наблюдений
- •3.2.1. Равное число наблюдений
- •3.2.2. Неравное количество наблюдений
- •3.3. Пример проверки гипотезы
- •3.4. Рациональные схемы вычислений
- •§4. Классификация по нескольким признакам
- •4.1. Двусторонняя классификация с повторениями
3.2.2. Неравное количество наблюдений
Если ряды данных разной длины, то надо либо усечь более длинный ряд, либо добавить требуемое количество измерений в более короткий. Иметь равное количество наблюдений на каждом уровне проведения эксперимента желательно из-за простоты интерпретации результатов. Но если все же на разных уровнях имеется разное количество наблюдений, то тогда формула для S1 несколько усложнится и будет выглядеть так:
,
для S2 расчетная формула останется без изменений.
3.3. Пример проверки гипотезы
Предположим, что необходимо проверить разницу между результатами некоторых тестов четырех испытуемых групп при проведении по 10 экспериментов для каждой группы. Данные приводятся в табл. 6.7.
Таблица 6.7
№п/п |
1 гр. |
2 гр. |
3 гр. |
4 гр. |
№п/п |
1 гр. |
2 гр. |
3 гр. |
4 гр. |
1 |
10 |
21 |
9 |
17 |
6 |
11 |
23 |
10 |
18 |
2 |
10 |
22 |
11 |
15 |
7 |
11 |
19 |
9 |
19 |
3 |
12 |
22 |
10 |
19 |
8 |
12 |
20 |
9 |
10 |
4 |
10 |
20 |
10 |
22 |
9 |
14 |
25 |
16 |
20 |
5 |
15 |
27 |
15 |
20 |
10 |
10 |
21 |
12 |
10 |
Этот тип проверки представляет собой данные для классификации по одному признаку с равным числом наблюдений на каждом уровне. В этом случае р= 4,n= 10. Подставив данные из табл. 6.7, значенияриnв формулы табл. 6.6, получим табл. 6.8.
Таблица 6.8
Источник изменчивости |
Суммы квадратов |
Степени свободы |
Средние квадраты |
Отношение |
Различия 1 Различия 2 |
163,1 928,5 |
3 36 |
54,367 25,792 |
2,11 2,87 (>) |
Сумма |
1091,6 |
39 |
|
Принимается |
Иными словами, данных, что между группами существуют различия, нет, т.е. группы равнозначны. Поэтому, с одной стороны, можно обрабатывать группы вместе как единый ряд наблюдений, а с другой стороны, результаты обработки данных по одной из групп могут быть обобщены на все группы, так как они имеют сходные характеристики.
3.4. Рациональные схемы вычислений
Для облегчения вычислений, если последние выполняются вручную, можно предложить несколько иные формы записи переменных для построения таблиц дисперсионного анализа (табл. 6.6)
;
;
,
анализируя которые можно предложить следующий алгоритм вычисления данных сумм.
Шаг 1. Просуммировать наблюдения для каждого уровня и получить для каждогоj, а также найти общую сумму.
Шаг 2. Возвести каждое наблюдение в квадрат и повторить подсчет, как в первом пункте, т.е. найти суммы квадратов наблюдений по строкам и общую сумму квадратов.
Шаг 3. Найденные суммы квадратов на шаге 1 возводим в квадрат. Таким образом будут найдены суммы квадратов . Полученный результат надо разделить нар.
Шаг 4. Общую сумму, найденную на первом шаге, возвести в квадрат и разделить на N.
Шаг 5. Теперь легко образовать S,S1иS2 из всего, что было вычислено в шагах 1 - 4 по формулам табл. 6.6.