- •Биометрическая обработка данных на основе компьютерной программы statistica
- •Предисловие
- •Раздел 1. Характеристика программы statistica
- •Организация системы statistica
- •1.2. Статистические методы программы statistica
- •Раздел 2. Параметрические критерии
- •2.1. Описательная статистика Методы описательной статистики (Descriptive statistics) и характеристика статистических совокупностей
- •2.2. Статистические оценки генеральных параметров Оценка ошибок репрезентативности
- •Оценка ошибок репрезентативности
- •Показатель точности оценок
- •Оценка доверительного интервала средней арифметической –
- •Оценка доверительного интервала дисперсии –
- •2.3. Проверка нормальности эмпирического распределения Функции нормального распределения и методы оценки нормальности эмпирического распределения
- •Проверка нормальности эмпирического распределения
- •2.4. Параметрические критерии сравнения средних
- •Раздел 3. Непараметрические критерии
- •3.1. Сравнение независимых выборок
- •Сравнение зависимых групп
- •3.3. Сравнение номинальных (категориальных) переменных
- •Раздел 4. Корреляционный анализ
- •4.1. Параметрические показатели связи
- •4.2. Непараметрические показатели связи
- •Методика расчета коэффициент ранговой корреляции Спирмена ( )
- •Методика расчета коэффициента корреляции Спирмена ( )
- •4.3. Оценка связи между номинальными величинами
- •Раздел 5. Дисперсионный анализ
- •5.1. Однофакторный дисперсионный анализ
- •5.2. Двухфакторный дисперсионный анализ
- •Раздел 6. Регрессионный анализ
- •Раздел 7. Кластерный анализ
- •Раздел 8. Дискриминатный анализ
- •Оглавление
- •625003, Г. Тюмень, Семакова,10
Раздел 5. Дисперсионный анализ
Задачей дисперсионного анализа является оценка влияния одного (однофакторный дисперсионный анализ) или нескольких факторов (двух-, трехфакторный дисперсионный анализ) на исследуемый признак. Дисперсионный анализ позволяет оценить достоверность отличий нескольких выборочных средних одновременно. В основе этого статистического анализа лежит разложение общей изменчивости признака на составляющие.
1. в случае однофакторного дисперсионного анализа общая дисперсия представляет сумму двух слагаемых:
общая= факт. + случ.
факт. – дисперсия, определяемая влиянием изучаемого фактора;
случ. – дисперсия, определяемая вариацией случайных факторов
2. в случае двухфакторного дисперсионного анализа общая дисперсия представляет сумму четырех слагаемых:
общая= А + В + АВ + случ. , А и В – дисперсии, обусловленные вариацией факторов А и В, АВ – дисперсия, определяемая совместным действием факторов А и В.
При проведении дисперсионного анализа формируется дисперсионный комплекс – система выборочных совокупностей, объединенных для совместного изучения. Дисперсионные комплексы могут быть формированы как при планировании исследований, так и на основе эмпирических данных.
При формировании дисперсионных комплексов должны быть соблюдены следующие условия:
1) выборки, включаемые в дисперсионный комплекс должны составляться по принципу рандомизации, то есть способом случайного отбора; число выборок соответствует числу факторов или числу градаций факторов;
2) действующие на признак регулируемые факторы должны быть независимыми друг от друга.
Если оценивают действие на признак одного регулируемого фактора, дисперсионный комплекс называют однофакторным. Если одновременно оценивают действие на признак двух, трех и большего числа регулируемых факторов, комплекс называют многофакторным.
Выборки, включаемые в дисперсионный комплекс могут быть одинаковые по объему или равномерные; неодинаковые по объему или неравномерные.
Рассмотрим статистический однофакторный комплекс (система разнородных групп, объединенных для совместного изучения).
Пример 1. Получены следующие данные по плодовитости мышей при облучении рентгеновскими лучами:
Контроль (1): 10; 12; 11; 10
Доза 100р. (2): 8; 10; 7; 9
Доза 200р. (3): 7; 9; 6; 4
Таблица 20
Статистический однофакторный комплекс для оценки влияния дозы облучения
Варьирующий признак (х1) |
Доза облучения - фактор А |
Число градаций: а=3 |
||
1 |
2 |
3
|
||
Х1 |
10 12 11 10 |
8 10 7 9 |
7 9 6 4 |
Поправка
|
Число вариант |
4
|
4 |
4 |
N=12 |
Сумма вариант |
43 |
34 |
26 |
=103 |
|
10,75 |
8,5 |
6,5 |
|
|
43²:4=4 62.5 |
34²:4= 289 |
26²:4= 169 |
=920,25 |
|
100 144 121 100 |
64 100 49 81 |
49 81 64 16 |
=941 |
Число градаций изучаемого фактора (А) – три. Число объектов первой градации – 4, второй – 4, третьей– 4. четвертой породы – 4. После обработки статистического комплекса оформляется сводная таблица однофакторного дисперсионного комплекса.
Средний квадрат отклонений, вызванный оцениваемым фактором, составляет:
Находят сумму квадратов отклонений – дисперсию, обусловленную внутригрупповой изменчивостью Сz – случайная (остаточная) дисперсия.
,
где∑∑x² - сумма квадратов всех значений, ∑Hi - сумма средних квадратов по градациям.
Число степеней свободы
Средний квадрат отклонений вызванный внутригрупповой изменчивостью составляет .
Находят сумму квадратов отклонений обусловленную всеми значениями комплекса: , где - сумма квадратов всех значений, - средний квадрат по дисперсионному комплексу.
Число степеней свободы .
Варианса или средний квадрат отклонений вызванный всеми значениями комплекса составляет: .
Следующий показатель сводной таблицы дисперсионного анализа критерий Фишера .
Сравнивают с табличным значением (табл.11). Стандартное (табличное) значение критерия Фишера для числа степеней свободы 2, 9 составляет 4,26 . Стандартное значение критерия Фишера меньше фактического, 4,26 меньше 7,89.
Вывод. Угнетающее действие рентгеновских лучей на плодовитость мышей велико (63%) и достоверно (с вероятностью Р>0,95).
Таблица 21
Сводная таблица однофакторного дисперсионного анализа
Изменчивость |
Сумма квадратов (дисперсия) |
Степеней свободы |
Варианса или средний квадрат |
Степень влияния факторов |
Факториальная,х (межгрупповая средняя)
|
|
а-1= 3-1=2 |
|
|
Остаточная,z (варианты внутри группы)
|
|
N-а= 12-3=9 |
|
= Сz:Су= 0,37 |
Общая,у (данные для всего комплекса) |
|
N-1= 12-1=11 |
|
|