- •1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
- •1.1. Законы распределения дискретных случайных величин
- •1.2. Числовые характеристики дискретных случайных величин, их свойства
- •1.3. Законы распределения непрерывных случайных величин
- •1.4. Числовые характеристики непрерывных случайных величин
- •1.5. Выборочные аналоги интегральной и дифференциальной функций распределения
- •1.6. Лабораторная работа № 1. Методы описательной статистики в пакете STATGRAPHICS
- •1.7. Нормальное распределение и его числовые характеристики
- •2. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ
- •2.1. -распределение
- •2.5. Гамма–распределение
- •2.7. Лабораторная работа № 2. Семейства вероятностных распределений в математических пакетах STATGRAPHICS и MAHTCAD
- •3. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ (МЕТОД МОНТЕ-КАРЛО)
- •3.1. Общие принципы метода статистических испытаний
- •3.2. Датчики базовой случайной величины (БСВ)
- •3.3. Моделирование на ЭВМ стандартной равномерно распределенной случайной величины (базовой случайной величины)
- •3.5. Моделирование непрерывных случайных величин
- •3.6. Лабораторная работа № 3. Моделирование некоторых распределений с помощью базовых случайных величин в пакете MATHCAD
- •4. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ И ИХ СВОЙСТВА
- •4.1. Статистические характеристики вариационных рядов и показатели их качества
- •4.3. Точечные оценки вероятности по частоте, математического ожидания и дисперсии
- •4.5. Методы получения точечных оценок
- •4.6. Сущность интервального оценивания
- •4.7. Приближенные и точные доверительные интервалы для параметров распределений
- •4.8. Лабораторная работа № 4. Оценивание параметров вероятностных распределений в пакетах STATGRAPHICS и MATHCAD
- •5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ СОГЛАСИЯ
- •5.1. Понятие статистической гипотезы. Основные этапы проверки гипотез
- •5.2. Критерий Неймана – Пирсона
- •5.3. Проверка гипотез о числовых значениях параметров нормального распределения
- •5.4. Проверка гипотез о параметрах двух нормальных распределений
- •5.5. Лабораторная работа № 5. Проверка статистических гипотез о числовых значениях нормальных распределений в математических пакетах STATGRAPHICS и MATHCAD
- •5.6. Критерии согласия
- •Решение
- •5.7. Лабораторная работа № 6. Критерии согласия в статистическом пакете STATGRAPHICS
- •5.8. Лабораторная работа №7. Критерии согласия в математическом пакете MATHCAD
- •6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
- •6.1. Постановка задачи
- •6.2. Дисперсионный анализ
- •Решение
- •6.3. Ранговый однофакторный анализ
- •6.4. Критерий Краскела - Уоллиса (Н-критерий)
- •Решение
- •6.5. Лабораторная работа № 8. Однофакторный ранговый и дисперсионный анализ в статистическом пакете STATGRAPHICS
- •7. РЕГРЕССИОННЫЙ АНАЛИЗ
- •7.1. Модели регрессии
- •7.4. Проверка адекватности линейной регрессии
- •7.5. Выбор наилучшей регрессии
- •8. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ
- •8.2. Критерий знаков
- •8.3. Критерий знаков для одномерной выборки
- •8.4. Ранговый критерий (одновыборочный критерий Вилкоксона)
- •8.5. Двухвыборочный ранговый критерий Вилкоксона
6.4. Критерий Краскела - Уоллиса (Н-критерий)
Если нельзя сказать что-то определенное об альтернативах к H0 ,
можно воспользоваться для ее проверки свободным от распределения Н- критерием. Он был предложен Краскелом и Уоллисом и является обобщением двухвыборочного критерия Вилкоксона .
Построим общий вариационный ряд, содержащий n1 + n2 +... + nk = n элементов, где n j - число наблюдений в j -й подвы-
борке (на j -м уровне фактора). Используем обозначения подразд. 6.2. Тогда R• j - сумма рангов каждой обработки, т.е. каждого столбца табл. 6,
а R j - среднее арифметическое этих рангов. Формулы для их нахождения таковы:
|
|
|
|
|
|
|
|
|
|
|
n j |
|
|
|
|
|
|
|
|
1 |
|
n j |
|
1 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
R• j = ∑rij , |
|
R |
j |
= |
|
∑rij |
= |
R• j . |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
n j i=1 |
|
n j |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
n(n +1) |
|
|
|
|
|
|
|
|
|
|||||
M (R j )= |
M |
1 |
R |
= |
1 |
∑ |
k = |
1 |
|
= |
n +1 |
как среднее арифмети- |
|||||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
n |
j |
• j |
|
n |
|
n |
2 |
|
|
|
|
2 |
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
k |
=1 |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n(n +1) |
|
|
|||||
ческое всех рангов от единицы до |
n , |
а 1 + 2 + ... + n = |
|
. Отсюда |
|||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
M (R |
)= |
n j (n +1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
||||||||||
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
• j |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если между столбцами нет систематических различий, средние ранги R j не должны значительно отличаться от среднего ранга, рассчитанного по всей совокупности чисел rij . Математическое ожидание среднего ран-
га, очевидно, равно M (R)= (n +1)2 .
Более сложным образом рассчитывается дисперсия. Для R j она рав-
|
|
|
(n +1)(n − n j ) |
|
j − M ( |
|
j ) |
|
|||
|
|
|
R |
R |
|
||||||
на D(R j )= |
|
||||||||||
|
. Если n → ∞ , то дробь |
|
D( |
|
j ) |
имеет в |
|||||
|
|
|
|||||||||
|
|
|
12n j |
|
R |
|
пределе стандартное нормальное распределение, что и использовали Краскел и Уоллис для построения статистики критерия, которую они обозначили буквой H и которая имеет вид
Фрэнк Вилкоксон (Уилкоксон) (1892-1965) – американский математик.
170
|
|
|
|
n +1 2 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|||||
k |
R j − |
|
|
|
|
|
n j |
|
||||
|
|
|
|
|||||||||
|
|
2 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
H = ∑ |
|
|
|
|
|
|
|
− |
|
(6.4.1) |
||
|
|
|
|
|
|
|
1 |
|
. |
|||
j =1 |
|
(n +1)(n − n j ) |
|
n |
|
|
||||||
|
|
|
|
12n j |
|
|
|
|
|
|
Краскел и Уоллис показали, что асимптотически статистика H имеет χ2 -распределение с (k −1) степенью свободы, где k - число подвыборок
(уровней фактора). Часто статистика H записывается в одном из следующих двух видов:
|
|
|
12 |
|
|
k |
|
|
|
|
n +1 |
2 |
|
|||
|
|
|
|
|
|
|
|
|
|
|||||||
H |
= |
|
|
|
∑n j R j − |
|
|
, |
(6.4.2) |
|||||||
n(n +1) |
2 |
|||||||||||||||
|
|
j =1 |
|
|
|
|
|
|
|
|||||||
или |
|
|
|
|
|
|
|
R2 |
|
|
|
|
|
|
||
|
|
|
12 |
|
|
k |
|
− 3(n +1). |
|
|||||||
H = |
|
|
∑ |
|
• j |
|
(6.4.3) |
|||||||||
n(n +1) |
|
n |
j |
|
||||||||||||
|
|
|
j =1 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Если два или более наблюдений совпадают, то наилучшая процедура состоит в том, что совпавшим наблюдениям нужно приписать один и тот же ранг, равный среднему арифметическому рангов, которые эти наблюдения должны были получить, если бы они не совпали. Эта операция оставляет без изменения сумму рангов и математическое ожидание суммы рангов. Но формула для вычисления дисперсии меняется, так как диспер-
сия статистики R j зависит от суммы квадратов рангов, которая от такой
замены изменится. Изменится и вид статистики H , поэтому ее исправляют соответствующей поправкой.
Если совпадений много, рекомендуется использовать модифицированную форму статистики H / :
H / |
= |
|
H |
|
|
, |
(6.4.4) |
|
|
p |
|
||||||
|
|
|
T j |
|
|
|
||
|
|
1 − ∑ |
|
|
|
|
||
|
|
|
3 |
|
||||
|
|
|
j =1n |
− n |
T j = (t3j − t j ), t j - число |
|||
где p - число групп совпадающих наблюдений, |
совпадающих наблюдений в группе с номером j .
Пример. Кислота непрерывным образом концентрируется на некотором типе оборудования, в результате чего часть оборудования ржавеет и со временем разрушается. Потери металла (в сотнях тонн) за период от установки оборудования до момента разрушения некоторой его части зафиксированы в таблице для трех литейных мастерских А, В и С. Прове-
171
рить нулевую гипотезу, по которой средняя продолжительность службы металла одна и та же для всех трех мастерских.
Мастерская |
|
|
|
|
Потери металла |
|
|
|
|||
А |
84 |
60 |
40 |
47 |
|
34 |
46 |
|
|
|
|
В |
67 |
92 |
95 |
40 |
|
98 |
60 |
59 |
108 |
86 |
117 |
С |
46 |
93 |
100 |
92 |
|
92 |
|
|
|
|
|
Решение
Никаких правдоподобных предположений о вероятностном распределении потерь металла в этой задаче сделать нельзя. Воспользуемся ранговым методом Краскела – Уоллиса. Надо заметить, что величины, приведенные в исходной таблице, имеют смысл сами по себе, а не только в сравнении с другими величинами. Хотя при переходе от величин потерь металла к их рангам происходит определенная потеря информации, но такая информация, во-первых, не столь значительна, во-вторых, компенсируется тем, что от неизвестного закона распределения величин xij мы
переходим к величинам rij , распределение которых при гипотезе H0 из-
вестно.
Основная гипотеза H0 постулирует постоянный срок службы метал-
ла во всех трех мастерских, т.е. постоянный уровень потерь, следовательно, однородность исходных выборок. Обозначим потери металла в j -й
группе через μ j . Тогда
H0 : μ1 = μ2 = μ3,
H1 : μi ≠ μ j , i ≠ j, 1 ≤ i ≤ 3, 1 ≤ j ≤ 3.
Сначала получим вариационный ряд и припишем каждому наблюдению его ранг. В связи с наличием в таблице совпадений будем пользоваться средними рангами.
Наблюдения |
34 |
40 |
40 |
46 |
46 |
47 |
59 |
60 |
60 |
67 |
84 |
Номер наблюде- |
|
|
|
|
|
|
|
|
|
|
|
ний в вариаци- |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
онном ряду |
|
|
|
|
|
|
|
|
|
|
|
Ранг |
1 |
2.5 |
2.5 |
4.5 |
4.5 |
6 |
7 |
8.5 |
8.5 |
10 |
11 |
Наблюдения |
86 |
92 |
92 |
92 |
93 |
95 |
98 |
100 |
108 |
117 |
|
Номер наблюде- |
|
|
|
|
|
|
|
|
|
|
|
ний в вариаци- |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
|
онном ряду |
|
|
|
|
|
|
|
|
|
|
|
Ранг |
12 |
14 |
14 |
14 |
16 |
17 |
18 |
19 |
20 |
21 |
|
172