- •Элементы
- •5.1. Проверка гипотез о параметрах распределений.
- •5.1.1. Проверка значения математического ожидания нормального распределения.
- •5.1.2. Проверка значения дисперсии нормального распределения.
- •5.1.3. Проверка значения доли (параметра биноминального распределения).
- •5.2. Сравнение выборок
- •5.2.1. Сравнение дисперсий
- •5.2.2. Сравнение средних двух независимых выборок
- •5.2.3. Сравнение средних парных выборок.
- •5.2.4. Сравнение долей (параметра биноминального распределения)
- •5.3. Проверка однородности выборок.
- •5.4. Дисперсионный анализ (anova)
- •5.4.1. Однофакторный дисперсионный анализ.
- •5.4.2. Многофакторный дисперсионный анализ.
5.2. Сравнение выборок
5.2.1. Сравнение дисперсий
Предположим, что имеется две выборки и, причёмираспределены по нормальному закону. Для проверки гипотезыпротив гипотезыможно в качестве критерия использовать статистику, которую называют дисперсионным отношением. Распределение этой случайной величины носит название-распределения, или распределения Фишера с двумя числами степеней свободы, и. В таблицах приводятся квантили, соответствующие вероятности, или значения, соответствующие вероятности противоположного неравенства. Для этих квантилей справедливо соотношение
,
которым можно воспользоваться для нахождения квантилей для тех значений , которых нет в таблице. Например, если требуется найти квантиль, найдём в таблице, откуда=.
В Excel функция FРАСП (х;)в меню «Статистические» вычисляет вероятность . ФункцияFРАСПОБР(р;)в том же меню выдаёт значение , соответствующее вероятности.
Очевидно, гипотезу о равенстве дисперсий надо отвергнуть, если дисперсионное отношение или слишком большое, или слишком малое, т.е. если , или.
В меню Excel СервисАнализ данных имеется удобная для проведения сравнения дисперсий двух выборок функцияДвухвыборочный F-тест для дисперсии,
позволяющая проводить этот анализ без промежуточных вычислений. В диалоговое окно этой функции вводятся координаты массивов сравниваемых выборок и уровень значимости. Все промежуточные вычисления находятся непосредственно в ходе работы программы, и в указанное поле выводится итоговая таблица, пример которой представлен ниже:
Двухвыборочный F-тест для дисперсии | ||
|
Переменная 1 |
Переменная 2 |
Среднее |
309,875 |
311,125 |
Дисперсия |
10,22916667 |
48,39583333 |
Наблюдения |
4 |
4 |
df |
3 |
3 |
F |
0,211364615 |
|
P(F<=f) одностороннее |
0,117039122 |
|
F критическое одностороннее |
0,107797789 |
|
Так как вычисленное значение F=0,211364615 больше F критическое одностороннее=0,107797789, то гипотезу о равенстве дисперсий нельзя отвергнуть на выбранном уровне значимости 0,05.
Обратите внимание на следующую особенность действия этой программы. Если поменять порядок ввода тех же массивов, то результат будет иметь вид:
Двухвыборочный F-тест для дисперсии |
| |
|
Переменная 1 |
Переменная 2 |
Среднее |
311,125 |
309,875 |
Дисперсия |
48,39583333 |
10,22916667 |
Наблюдения |
4 |
4 |
df |
3 |
3 |
F |
4,731160896 |
|
P(F<=f) одностороннее |
0,117039122 |
|
F критическое одностороннее |
9,276628154 |
|
Естественно, величина F при этом меняется на обратную, но и значение F критическое одностороннее также меняется на обратное, и знак неравенства для принятия гипотезы также надо сменить на обратный. Таким образом, если получилось значение F<1, то гипотезу мы принимаем, если F > F критическое одностороннее, а при F>1, если F< F критическое одностороннее.
Если имеется выборок объёмас выборочными дисперсиями, то для проверки гипотезыБартлет предложил критерий, который теперь называют его именем – критерий Бартлета:
,
Где - средневзвешенная выборочная дисперсия всехвыборок:
Бартлет показал, что при достаточно больших значениях распределение случайной величиныприближается к распределению хи-квадрат с числом степеней свободыи гипотезу о равенстве дисперсий следует отвергнуть на уровне значимости, если окажется, что