- •Глава 3. Описательная статистика
- •3.1. Случайные выборки и их описание
- •3.2. Оценка статистических параметров
- •3.2.1. Основные распределения статистических
- •3.2.2. Свойства статистических оценок
- •Оценка называется состоятельной, если
- •3.2.3. Определение точечных оценок
- •3.3. Построение доверительных интервалов
- •3.3.1. Построение доверительных интервалов
- •Методика определения доверительного интервала для математического ожидания сводится к следующему:
- •3.3.2. Построение доверительных интервалов
- •3.4. Формирование выборки
- •Приведем краткую классификацию отбора.
- •3.5. Построение гистограммы
- •Глава 4. Статистическая проверка гипотез
- •4.1. Проверка гипотезы об однородности двух или нескольких анализируемых совокупностей
- •4.2. Проверка гипотез о распределении
- •Решение. Результаты расчета включают:
- •4.2.2. Критерий однородности Смирнова
- •Задания для самостоятельной работы
- •4.3. Проверка гипотезы об однородности
- •4.3.1. Критерий Стьюдента (t-критерий)
- •В качестве критической статистики используется величина
- •Здесь tq, (n–1) – 100 % -я точка распределения Стьюдента с (n- 1) степенями свободы.
- •Решение
- •Задания для самостоятельной работы
- •4.3.2. Критерий Фишера (f-критерий)
- •4.3.3. Критерий Уилкоксона
- •Здесь критическая область примет вид {uUл(q,m,n)}.
- •4.3.5. Критерий знаков
Решение. Результаты расчета включают:
– математическое ожидание
3,926,
где - среднее значение вi-м интервале;
– дисперсию
0,370;
– среднеквадратичное отклонение
.
Нормирование границ интервалов производится по формуле
Функция нормального распределения находится из прил.1, например:
Ф(-4,44)=1–Ф(4,44)=1–0,999973=0,000003,
Ф(1,80)= 0,9664.
Теоретическая вероятность определяется как
fi= Фпi(t) – Флi(t).
Результаты расчета для каждого интервала приведены в табл.4.1.
Таблица 4.1. Результаты расчета к примеру 4.2
Номер интервала |
Границы интервалов |
Среднее в интервале |
Экспериментальная вероятность рэi | |
левая хл |
правая хп | |||
1 |
1,2 |
1,68 |
1,44 |
0,010 |
2 |
1,68 |
2,16 |
1,92 |
0,010 |
3 |
2,16 |
2,64 |
2,4 |
0,020 |
4 |
2,64 |
3,12 |
2,88 |
0,030 |
5 |
3,12 |
3,6 |
3,36 |
0,150 |
6 |
3,6 |
4,08 |
3,84 |
0,360 |
7 |
4,08 |
4,56 |
4,32 |
0,300 |
8 |
4,56 |
5,04 |
4,8 |
0,120 |
Окончание табл.4.1.
Номер интервала |
Нормированные границы интервалов |
Квантиль нормального распределения |
Теоретическая вероятность fi |
Квадраты разностей по формуле (4.6) | ||
левая tл |
правая tп |
Фл(t) левая |
Фп(t) правая | |||
1 |
–4,304 |
–3,541 |
0,000003 |
0,00012 |
0,00011 |
0,86900 |
2 |
–3,541 |
–2,777 |
0,00012 |
0,0019 |
0,00178 |
0,03782 |
3 |
–2,777 |
–2,014 |
0,0019 |
0,01745 |
0,01555 |
0,00127 |
4 |
–2,014 |
–1,251 |
0,01745 |
0,0918 |
0,07435 |
0,02645 |
5 |
–1,251 |
–0,488 |
0,0918 |
0,2946 |
0,20280 |
0,01375 |
6 |
–0,488 |
0,275 |
0,2946 |
0,5987 |
0,30410 |
0,01028 |
7 |
0,275 |
1,038 |
0,5987 |
0,8508 |
0,25210 |
0,00910 |
8 |
1,038 |
1,801 |
0,8508 |
0,9664 |
0,11560 |
0,00017 |
Рассчитаем критерий Пирсона:
= n96,7843.
Критические значения: χ20,975 = 1,69, χ20,025 = 16,0.
Заключение: поскольку расчетное значение критерия Пирсона превышает верхнюю границу ,то гипотеза о нормальном распределении должна быть отвергнута.
4.2.2. Критерий однородности Смирнова
Для проверки гипотез (4.2) об однородности двух или более выборок используют критерий однородности:
Н0 : F1(x) = F2(x) = … Fl (x).
В частном случае для двух выборок (т.е. при l = 2) в качестве критической статистики используется критерий однородности Смирнова в виде
, |
(4.7) |
где число элементов выборок;
m1i , m2i количество элементов первой и второй выборок, попавших вi-й интервал.
При условии справедливости гипотезы Н0 : F1(x) = F2(x)величинаγбудет приблизительно распределена по законуχ2 с(k–1)степенью свободы. ГипотезаН0 отвергается, если или, и принимается при всех остальных значениях критерия.
Пример 4.3.В табл. 4.2 приведены условные данные о заработной плате работников текстильной и машиностроительной отраслей, полученные в результате социологического опроса. Объемы двух выборок выразятся какn1 = n2 = 100.
Решение. Проверим гипотезу (при уровне значимостиq= 0,05) о том, что распределения вероятностей по заработной плате в анализируемых отраслях не отличаются друг от друга.
Вычисление критерия Смирнова (4.7) дает
.
Из таблиц χ2-распределения определяем критическую точку: . Следовательно, гипотезу о совпадении вероятностных распределений заработной платы в двух отраслях необходимо отвергнуть: . Вероятность ошибиться при этом равна0,05.
Таблица 4.2. Данные к примеру 4.3
Номер интер-вала |
Интервал зар. платы в у.е. |
Количество элементов выборки, попавших в данный интервал |
m1j+ m2j |
m1j – m2j | |
Текстиль m1j |
Машиностроение m2j | ||||
1 |
130 –150 |
4 |
1 |
5 |
3 |
2 |
150 – 170 |
4 |
1 |
5 |
3 |
3 |
170 – 200 |
15 |
8 |
23 |
7 |
4 |
200 – 250 |
51 |
43 |
94 |
8 |
5 |
250 – 300 |
22 |
34 |
56 |
–12 |
6 |
300 – 350 |
3 |
7 |
100 |
–4 |
7 |
350 – 400 |
1 |
3 |
4 |
–2 |
8 |
400 – 450 |
- |
3 |
3 |
–3 |
Критерий однородности Смирнова относится к непараметрическим критериям (в отличие от критерия Пирсона), т.к. используемая в нем критическая статистика никак не зависит от наших предположений относительно закона распределения случайной величины.