- •Статистика в Excel
- •Глава 5. Проверка статистических гипотез
- •§5.1. Статистические гипотезы
- •§5.2. Критерий Фишера (f-тест) сравнения двух выборочных дисперсий
- •§5.3. Критерий Стьюдента (t-тест) сравнения выборочных средних двух независимых выборок
- •§5.4. Модифицированный критерий Стьюдента (парный t-тест) сравнения выборочных средних двух зависимых выборок
- •Практические задания
- •5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок
- •5.2. Сравнение выборочных средних двух зависимых выборок
- •Задания для самостоятельного выполнения
- •Контрольные вопросы
- •Рекомендуемая литература
Практические задания
5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок
Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:
хi |
11 |
10 |
8 |
10 |
10 |
12 |
11 |
8 |
12 |
10 |
8 |
12 |
уi |
7 |
7 |
6 |
8 |
9 |
10 |
8 |
9 |
11 |
7 |
8 |
9 |
Установить с уровнем значимости =0,05, влияет ли данный препарат на зрительную память?
Для выполнения этого задания проделайте следующие пункты.
Наберите исходные данные в две колонки: в столбец А, в столбец В.
Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду СервисАнализ данных.
В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.
В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными А1:А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.
Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными В1:В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.
Проверьте, установлен ли необходимый вам уровень значимости . По умолчанию в поле Альфа установлено значение 0,05.
В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.
В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду ФорматСтолбецАвтоподбор ширины.
Полученная таблица должна иметь вид:
Двухвыборочный F-тест для дисперсии |
|
|
|
Переменная 1 |
Переменная 2 |
Среднее |
10,16666667 |
8,25 |
Дисперсия |
2,333333333 |
2,022727273 |
Наблюдения |
12 |
12 |
df |
11 |
11 |
F |
1,153558052 |
|
P(F<=f) одностороннее |
0,408471047 |
|
F критическое одностороннее |
2,817927225 |
|
В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.
Из полученной таблицы следует, что средние =10,16666667; =8,25 (Среднее); исправленные дисперсии =2,333333333; =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n=12; числа степеней свободы (4.2) распределения Фишера (df) kх=11 и kу=11; наблюдаемое значение критерия Фишера (F) =1,153558052; критические точки распределения Фишера для заданного уровня значимости =0,05 правосторонней критической области (F критическое одностороннее) Fa(kх, kу)=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее) P( <Fa)=0,408471047.
Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,15<2,815=F0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).
Теперь следует сравнить средние двух выборок. Поскольку с помощью F-теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.
Для его вызова выполните команду СервисАнализ данных, выделите нужный инструмент и нажмите ОК.
В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группе Параметры вывода в поле Выходной интервал укажите адрес ячейки С12.
После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t-теста должна появиться таблица:
Двухвыборочный t-тест с одинаковыми дисперсиями |
||
|
Переменная 1 |
Переменная 2 |
Среднее |
10,16666667 |
8,25 |
Дисперсия |
2,333333333 |
2,022727273 |
Наблюдения |
12 |
12 |
Объединенная дисперсия |
2,178030303 |
|
Гипотетическая разность средних |
0 |
|
df |
22 |
|
t-статистика |
3,181194744 |
|
P(T<=t) одностороннее |
0,002159563 |
|
t критическое одностороннее |
1,717144187 |
|
P(T<=t) двухстороннее |
0,004319126 |
|
t критическое двухстороннее |
2,073875294 |
|
Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F-теста. После t-теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) 2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k=22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости =0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( <ta)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P( <ta)=0,004319126 критические области.
Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =3,18>2,07=t0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.