Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задание №2-5 (дисперс. анализ_регрессия).doc
Скачиваний:
9
Добавлен:
13.05.2015
Размер:
434.18 Кб
Скачать

Лабораторная работа № 6

Тема: Применение дисперсионного анализа при обработке информации.

Дисперсионный анализ

Одна из задач статистики связана с сопоставлением параметров распределения выборок, т.е. с определением существенных различий в значениях параметров однотипных выборок. Наиболее широкое распространение получил дисперсионный анализ. В дисперсионном анализе исследуются методы проверки гипотезы о равенстве математических ожиданий случайных величин, представленных выборками ограниченного объема. Непосредственное сравнение оценок математических ожиданий совокупности выборок оказывается менее эффективным, чем сопоставление оценок дисперсий, это обстоятельство и дало наименование методу. Подобные задачи возникают при исследовании влияния каких-либо параметров на показатели качества объекта, например: привела ли модернизация оборудования к снижению времени обработки запросов; влияет ли размер кэша второго уровня на производительность системы при решении конкретных задач обработки данных. Эти задачи решаются в рамках однофакторного дисперсионного анализа. В более сложных ситуациях исследуется влияние нескольких факторов на нескольких уровнях (многофакторный дисперсионный анализ). Далее будет рассмотрен только однофакторный анализ.

Однофакторный дисперсионный анализ позволяет установить, оказывает ли существенное влияние некоторый фактор Ф на исследуемую случайную величину.

Задача сравнения выборок случайных величин формулируется следующим образом.

Имеются результаты наблюдений в виде совокупности групп наблюдений, задан уровень значимости α для проверки статистической гипотезы. В данном случае отдельные группы трактуются как выборки одной и той же случайной величины, полученные по результатам наблюдения за одним объектом при различных значениях фактора Ф (количество уровней фактора равно m).

Требуется проверить нулевую гипотезу Н0 о равенстве математических ожиданий случайных величин всех выборок. Иначе говоря, требуется установить, значимо или незначимо различаются выборочные средние значения, вычисленные для каждого слоя.

Допущения: генеральные совокупности, соответствующие каждому слою, распределены нормально; дисперсии слоев одинаковы; математические ожидания, дисперсии, законы распределения случайных величин для различных слоев неизвестны, сами случайные величины являются непрерывными. Вполне понятно, что первые два условия являются наиболее существенными и весьма ограничивают область применения методов дисперсионного анализа.

Основная идея дисперсионного анализа состоит не в сопоставлении математических ожиданий случайных величин, а в сравнении оценки "факторной дисперсии", порождаемой воздействием фактора, и оценки "остаточной дисперсии", обусловленной случайными причинами. Если различие между этими оценками значимо, то фактор оказывает существенное влияние на случайную величину, в противном случае влияние фактора несущественно. Если установлено существенное влияние фактора, то каждой группе соответствует своя оценка математического ожидания. Упорядочение значений оценок математического ожидания позволит выявить влияние фактора.

Пример 1. Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Доказать это предположение.

Результаты представлены в табл. 1.

Таблица 1. Количество воспроизведенных слов (по J. Greene, M D'Olivera, 1989, p. 99)

№ испытуемого

Группа 1 низкая скорость

Группа 2 средняя скорость

Группа 3 высокая скорость

1

8

7

4

2

7

8

5

3

9

5

3

4

5

4

6

5

6

6

2

6

8

7

4

суммы

43

37

24

средние

7,17

6,17

4,00

Общая сумма

104

 

 

Известно, что данные подчиняются нормальному закону распределения.

Выдвинем нулевую гипотезу: различия в объеме воспроизведения слов между группами являются случайными и не зависят от скорости предъявления слов.

Альтернативная гипотеза: Различия в объеме воспроизведения слов между группами являются не случайными и зависят от скорости предъявления слов.

Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок: