- •Элементы
- •5.1. Проверка гипотез о параметрах распределений.
- •5.1.1. Проверка значения математического ожидания нормального распределения.
- •5.1.2. Проверка значения дисперсии нормального распределения.
- •5.1.3. Проверка значения доли (параметра биноминального распределения).
- •5.2. Сравнение выборок
- •5.2.1. Сравнение дисперсий
- •5.2.2. Сравнение средних двух независимых выборок
- •5.2.3. Сравнение средних парных выборок.
- •5.2.4. Сравнение долей (параметра биноминального распределения)
- •5.3. Проверка однородности выборок.
- •5.4. Дисперсионный анализ (anova)
- •5.4.1. Однофакторный дисперсионный анализ.
- •5.4.2. Многофакторный дисперсионный анализ.
5.2.2. Сравнение средних двух независимых выборок
Предположим, что имеется две выборки и, причёмираспределены по нормальному закону с одинаковой (проверено двухвыборочным F-тестом для дисперсии), но неизвестной дисперсией . Требуется проверить гипотезу о равенстве математических ожиданийи. Разностьраспределена тоже по нормальному закону с математическим ожиданием, и дисперсией.
Оценкой может служить средневзвешенное значениедвух выборок:
Случайная величина
,
имеет распределение Стьюдента с степенями свободы. Поэтому в качестве критерия для проверки гипотезыможно взять статистку
При альтернативной гипотезе гипотезуможно принять, если. Если альтернативная гипотеза, то нулевая гипотеза принимается при условии, а при- при условии.
Если же дисперсии различны, то значение вычисляется по формуле
,
а число степеней свободы – наибольшее целое, не превосходящее значения
Конечно, все величины для вычисления можно находить отдельно. Но стоит обратить внимание на то, что вExcel в меню СервисАнализ данныхесть функции Двухвыборочный -тест с одинаковыми дисперсиями и Двухвыборочный -тест с разными дисперсиями для работы которых достаточно ввести просто координаты массивов и. Различия в этих функциях целиком описаны в их названиях, и, если выборочные дисперсии различаются не слишком сильно, то результаты оказываются идентичными. В качестве примера приведём результат действия функции « Двухвыборочный -тест с одинаковыми дисперсиями (B2:E2;B18:E18;0;0,05;G2)».
В ячейках находились результаты измерения концентрации первым студентов,-вторым, число 0 показывает, что мы проверяем гипотезу, 0,05 – установленный уровень значимости, и , наконец- номер ячейки, которую решено сделать левым верхним углом таблицы вывода результатов:
Двухвыборочный t-тест с одинаковыми дисперсиями | ||
|
Переменная 1 |
Переменная 2 |
Среднее |
309,875 |
311,125 |
Дисперсия |
10,22916667 |
48,39583333 |
Наблюдения |
4 |
4 |
Объединенная дисперсия |
29,3125 |
|
Гипотетическая разность средних |
0 |
|
df |
6 |
|
t-статистика |
-0,326511574 |
|
P(T<=t) одностороннее |
0,377563115 |
|
t критическое одностороннее |
1,943180274 |
|
P(T<=t) двухстороннее |
0,755126229 |
|
t критическое двухстороннее |
2,446911846 |
|
Как видим, программа определила объёмы каждой выборки (Наблюдения), их средние и дисперсии, оценку дисперсии генеральной совокупности (Объединенная дисперсия) число степеней свободы (df), и, наконец искомое значение ,соответствующее этим данным (t-статистика). Для проверки гипотезы надо сопоставить значение «t-статистика» с значением «t критическое одностороннее» в случае односторонних альтернативных гипотез, и со значением «t критическое двухстороннее» - при . Как видим, гипотезунет оснований отбрасывать, и различие средних результатов двух студентов можно считать случайным.
Кроме этого, в меню «статистические» имеется функция ТТЕСТ, которой тоже можно воспользоваться для сравнения средних двух выборок. Для этого в окна массивов вводятся их координаты. В окно «Хвосты» вводится 1 в случае односторонних альтернативных гипотез, и 2- при . В окно «Тип» вводится 1, если проводится сравнение пар, 2 – для теста с равными дисперсиями, и 3, - с неравными.