- •Проверка гипотезы о параметре pбиноминального распределения
- •Проверка гипотезы о независимости двух величин
- •Ранговая корреляция
- •Элементы регрессионного анализа
- •Проверка адекватности линейной регрессионной модели
- •Множественная линейная регрессия
- •Линейная регрессионная модель общего вида
- •Постановка задачи и оптимизация модели с помощью процедуры поиска решения
- •Факторный анализ
Проверка гипотезы о независимости двух величин
Пусть наблюдаются две случайные величины 1, 2и результаты наблюдений представлены в виде таблицы сопряженности признаков размера kl, nij – число наблюдений, в которых случайная величина 1 попала в i-й интервал, а 2 в j-й интервал, ,.
Таблица 3
|
|
|
… |
|
|
… | |||||
… | |||||
... |
… |
… |
… |
… |
… |
… | |||||
|
… |
|
Проверяется гипотеза H0, утверждающая, что случайные величины 1 и 2 независимы. Для проверки этой гипотезы используют статистику
(критерий )
, (3)
где =.
При условии, что гипотеза H0 верна, а все 4,i=1,2,…,k; j=1,2,..,l статистика (3) имеет распределение с (k-1)(l-1) степенями свободы.
Гипотеза H0 о независимости случайных величин 1 , 2 принимается на уровне значимости , если выборочное значение статистики (3) меньше квантили, т.е. если
. (4)
В противном случае гипотеза H0 отклоняется.
Формулу (3) можно преобразовать к виду, удобному для вычисления:
(5)
Если для некоторых клеток таблицы не удовлетворяют условию4, то соответствующие строки и столбцы должны быть объединены с соседними строками и столбцами.
Пример.
Комплектующие изделия одного наименования поступают с трех предприятий A,B,C, результаты проверки изделий приведены в таблице
Таблица 4
Результаты проверки |
Поставщики |
Всего ni | |||
А |
В |
С |
| ||
Годные |
29 |
38 |
53 |
120 | |
Негодные |
1 |
2 |
7 |
10 | |
Всего nj |
30 |
40 |
60 |
130 |
Можно ли считать, что количество изделий не зависит от поставщика ? Принять =0,10.
Проверяется гипотеза о независимости двух признаков: качества изделия и места его изготовления. По формуле (5) находим
;
число степеней свободы (k-1)(l-1) = (2-1)(3-1) = 2. По таблице Приложения 4
.
2,546 = <= 4,61, следовательно гипотеза Но принимается, т.е. качество изделий не зависит от поставщика.
Дисперсионный анализ
Пусть результаты наблюдений составляют l независимых выборок(групп), полученных из нормальных совокупностей , которые имеют, вообще говоря, различные средние значения a1,a2,…,al и равные дисперсии .Соответственно объемы выборокn1, n2, …, nl, - общее число наблюдений. Проверяется гипотеза Н0: a1=a2=…=al.
Для l = 2 используются рассмотренные ранее критерии значимости.
Если l > 2, то для проверки гипотезы о равенстве l средних применяют однофакторный дисперсионный аналіз.
Суть однофакторного дисперсионного анализа заключается в следующем:
обозначим xik - i-й элемент k-ой выборки ,,- выборочное среднее k-ой выборки ,,
- общее выборочное среднее, .
Основное тождество дисперсионного анализа записывается так:
(6)
Запишем его в виде:
Q= Q1+Q2 , (7)
где Q- общая сумма квадратов отклонений наблюдений от общего среднего ,
Q1- сумма квадратов отклонений выборочных средних от общего среднего ,
Q2- сумма квадратов отклонений наблюдений от групповых средних,
Q 0 , Q1 0, Q2 0
Рассматривается статистика , (8)
имеет распределение Фишера с (l-1)(n-l) степенями свободы.
Если выполняется неравенство
, (9)
то Н0 гипотеза принимается на уровне значимости .
Пример .
Три группы водителей обучались по различным методикам. После окончания срока обучения был произведен тестовый контроль над случайно отобранными водителями из каждой группы. Получены следующие результаты
Таблица 5
Номер группы k |
Число ошибок xik допущенных водителем |
Сумма |
Число контролирующих водителей nk |
1 |
1 3 2 1 0 2 1 |
10 |
7 |
2 |
2 3 2 1 4 - - |
12 |
5 |
3 |
4 5 3 - - - |
12 |
3 |
На уровне значимости = 0,05 проверить гипотезу об отсутствии влияния различных методик обучения на результаты тестового контроля водителей. Предполагается ,что выборки получены из нормальных совокупностей с одной и той же дисперсией.
Н0: a1=a2=a3, l = 3, n = 15.
Вычисление удобно проводить в следующей последовательности :
,
,
,
.
По формуле (8) получим
.
По таблице Приложения 5 находим квантиль распределения Фишера
,
6,52 = ,
т.е. неравенство (9) не выполняется. Следовательно, результаты тестового контроля зависят от методики обучения , т.е. методики значимо различаются .