- •Глава 3. Описательная статистика
- •3.1. Случайные выборки и их описание
- •3.2. Оценка статистических параметров
- •3.2.1. Основные распределения статистических
- •3.2.2. Свойства статистических оценок
- •Оценка называется состоятельной, если
- •3.2.3. Определение точечных оценок
- •3.3. Построение доверительных интервалов
- •3.3.1. Построение доверительных интервалов
- •Методика определения доверительного интервала для математического ожидания сводится к следующему:
- •3.3.2. Построение доверительных интервалов
- •3.4. Формирование выборки
- •Приведем краткую классификацию отбора.
- •3.5. Построение гистограммы
- •Глава 4. Статистическая проверка гипотез
- •4.1. Проверка гипотезы об однородности двух или нескольких анализируемых совокупностей
- •4.2. Проверка гипотез о распределении
- •Решение. Результаты расчета включают:
- •4.2.2. Критерий однородности Смирнова
- •Задания для самостоятельной работы
- •4.3. Проверка гипотезы об однородности
- •4.3.1. Критерий Стьюдента (t-критерий)
- •В качестве критической статистики используется величина
- •Здесь tq, (n–1) – 100 % -я точка распределения Стьюдента с (n- 1) степенями свободы.
- •Решение
- •Задания для самостоятельной работы
- •4.3.2. Критерий Фишера (f-критерий)
- •4.3.3. Критерий Уилкоксона
- •Здесь критическая область примет вид {uUл(q,m,n)}.
- •4.3.5. Критерий знаков
Здесь критическая область примет вид {uUл(q,m,n)}.
В таблицах обычно приводятся критические значения, соответствующие числам qиз ряда0,05, 0,025, 0,01, 0,005, 0,001. Ввиду дискретного характера распределения вероятностей между возможными значениями случайной величиныUприведенные выше уравнения не всегда имеют точное решение и в таблицах они приводятся приближенно. Для вычисления по таблицам значенийUл(q,m,n)можно воспользоваться соотношением
Uл(q,m,n)+ Uп(q,m,n) = mn,
вытекающим из симметрии распределения статистики Uотносительно своего центраmn/2.
3. Отвергнем гипотезу Н0 против правосторонних (левосторонних) альтернатив при попадании Uнабл в соответствующую критическую область.
4. При проверке Н0 против двусторонних альтернатив в качестве критического множества можно взять объединение
{U Uл(q,m,n)} {U Uп(q,m,n)},
т.е. отвергнуть Н0, если происходит одно из двух ранее упомянутых критических событий. Ввиду уже отмеченной симметрии этому критерию можно дать вид
.
При таком выборе критического множества уровень значимости удваивается. Теперь он равен 2q(с теми же оговорками насчет дискретности распределенияU, что были сделаны выше). Если мы желаем сохранить и здесь уровень значимостиq, надо взятьU(q/2,m,n)иUп(q/2,m,n).
4.3.5. Критерий знаков
Покажем, как использовать критерий знаков для анализа данных о времени реакции на звук и свет (табл. 4.6). В этом примере рассматривается группа испытуемых, а целью исследования служит проверка гипотезы о равенстве времени реакций на звук и свет. Порядок организации эксперимента позволяет предположить, что полученные данныеоб одном испытуемом независимы от аналогичных данных для остальных.
Осуществим переход от пар (хi, yi)к величинамzi, = yi – xi , i=1,… nи запишем последние в видеzi= + ei, i = 1,…, n, где – некоторая константа. Выполняются ли для сформулированной задачи допущения, используемые в критерии знаков? Независимость случайных величинeiобеспечивается условиями организации эксперимента.
В случае совпадения распределений времени реакции на звук и на свет справедливо следующее соотношение:
P((yi – xi)> 0) = P((yi – xi)< 0 ) = 1/2.
Следовательно, P(zi >0) = P(zi <0)= 1/2,то есть медиана распределенияziравна нулю. Гипотеза о равенстве времени реакций формируется в видеН0: = 0.
Одной из разумных альтернатив нулевой гипотезе в данном случае является предположение о том, что 0. Далее мы будем использовать критерий знаков против этой односторонней альтернативы Н1.
Пример 4.7. Возьмем исходные данные примера о времени реакции на звук и свет (табл. 4.6). С помощью критерия знаков проверим гипотезу о том, что реакция на свет и звук одинакова.
Решение. Обозначим число положительных значенийziчерезSнабл. Из табл.4.7 видно, чтоSнабл равно трем, а средиziесть одно значение, равное0. В таких случаях необходимо уменьшить число наблюденийziна число значенийzi, равных0, т.е. перейти отn =17кn = 16.
Вычислим вероятность P(S =Sнабл p=1/2). Для этого воспользуемся таблицами биноминального распределения приp=1/2, n = 16и рассчитаемP(S =Sнабл) по формуле (1.30):
.
Учитывая, что в силу симметрии приp = 1/2 P(S =Sнаб)= =P(S = n – Sнабл), полученные значения запишем в табл.4.8.
Найдем вероятность события S > Sнабл.
P(S >Sнаб p=1/2) =1–P(S Sнаблp=1/2) =1 – (P(S=0) +…+P(S= Sнабл)).
Таблица 4.7. Значения разностей реакций человека на свет и звук
i |
Xi |
Yi |
Zi |
S(xi) |
1 |
223 |
181 |
–42 |
– |
2 |
104 |
194 |
90 |
+ |
3 |
209 |
173 |
–36 |
– |
4 |
183 |
153 |
–30 |
– |
5 |
180 |
168 |
–12 |
– |
6 |
168 |
176 |
8 |
+ |
7 |
215 |
163 |
–52 |
– |
8 |
172 |
152 |
–20 |
– |
9 |
200 |
155 |
–45 |
– |
10 |
191 |
156 |
–35 |
– |
11 |
197 |
178 |
–19 |
– |
12 |
183 |
160 |
–23 |
– |
13 |
174 |
164 |
–10 |
– |
14 |
176 |
169 |
–7 |
– |
15 |
155 |
155 |
0 |
0 |
16 |
115 |
122 |
+7 |
+ |
17 |
163 |
144 |
–19 |
– |
Таблица 4.8. Расчетные значения вероятности
S |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
P(S =Sнабл ) |
0,00002 |
0,00024 |
0,00183 |
0,00854 |
0,0278 |
0,0667 |
0,1222 |
0,1746 |
P(S >Sнабл ) |
0,99998 |
0,99974 |
0,99791 |
0,98936 |
0,9616 |
0,8949 |
0,7728 |
0,5982 |
S |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
P(S =Sнабл ) |
0,1964 |
0,1746 |
0,1222 |
0,0667 |
0,0278 |
0,00854 |
0,00183 |
0,00024 |
0,00002 |
P(S >Sнабл ) |
0,4018 |
0,2273 |
0,1051 |
0,0384 |
0,0106 |
0,0021 |
0,00026 |
0,00002 |
0,00000 |
Из табл.4.8 видно, что
P(S > 16 –3 p=1/2) = P(S > 13 p=1/2) = 0,0021.
Таким образом, минимальный уровень значимости, на котором можно отвергнуть гипотезу о том, что = 0 против односторонней альтернативы, равен 0,0021. Учитывая малую этого числа, заключаем, что гипотезу следует принять.
Задания для самостоятельной работы
1. В табл.4.9 приведены данные об объеме продаж коммерческой фирмы за последние два года. Определите стабильность работы предприятия (т.е. однородность выборок), используя непараметрические методы.
Таблица 4.9. Исходные данные объема продаж фирмы
Месяц |
Год 2001 |
Год 2002 |
Январь |
50 |
43 |
Февраль |
53 |
51 |
Март |
51 |
53 |
Апрель |
64 |
49 |
Май |
67 |
62 |
Июнь |
65 |
66 |
Июль |
69 |
67 |
Август |
60 |
59 |
Сентябрь |
55 |
61 |
Октябрь |
47 |
52 |
Ноябрь |
51 |
43 |
Декабрь |
42 |
39 |
2. Сопоставьте результаты проверки гипотезы об однородности на основании критериев Уилкоксона и Манна–Уитни.
1Формулы для определения объема выборки для разных способов отбора приведены в книге «Теория статистики» под ред. Р.А.Шмойловой.
1 Отклонение гипотезы Н0 в случае «слишком малых» значений на первый взгляд противоречит здравому смыслу. Однако надо отметить, что γ является величиной случайной, т.е. величиной, подверженной обязательному разбросу. Поэтому одинаково неправдоподобными следует считать как слишком большие, так и слишком малые значения γ.
1 Слишком большое значение статистики t (4.9) может быть следствием как неоднородности математических ожиданий двух выборок, так и неоднородности дисперсий. Последнее может являться самостоятельной задачей исследований.
132 133