- •И математической статистике
- •Часть II основные методы математической статистики
- •Владивосток
- •Раздел I основные методы математической статистики
- •1. Генеральная совокупность и выборка
- •1.1 Выборочный метод. Первичная обработка выборочных (экспериментальных) данных.
- •1.2 Выборочные числовые характеристики.
- •Которая называется выборочным средним.
- •2. Точечное оценивание параметров распределений
- •2.1 Свойства оценок; неравенство Крамера – Рао.
- •2.2 Методы получения оценок.
- •3. Интервальное оценивание параметров
- •3.1. Необходимые понятия и функции распределения
- •1) 2) 3)Независимы.
- •3.2 Интервальное оценивание параметров.
- •3.3 Оценки параметров нормального распределения.
- •3.4 Интервальное оценивание параметров распределений, отличных от нормального
- •4.1. Основные определения и используемые понятия.
- •4.2. Критерии согласия
- •1). Критерий Колмогорова
- •2). Критерий хи-квадрат Пирсона
- •3). Критерий Смирнова – Мизеса (критерий ω2)
- •4.3. Проверка гипотез относительно двух выборок
- •4.4. Непараметрические ранговые критерии.
- •5. Дисперсионный анализ: однофакторная модель.
- •6. Элементы прикладного корреляционного анализа
- •6.1. Введение: основные задачи, понятия и терминология.
- •6.2. Корреляция
- •6.3. Ранговая корреляция и сопряжённость
- •6.4.* Выборочные методы частного и множественного
- •Заключение
- •Разлел II вариаты практических заданий
- •1. Общие положения.
- •2. Алгоритмы – формулы расчёта выборок и предлагаемое их
- •Раздел III
- •1. Табулирование данных
- •2. Построение интервального вариационного ряда
- •3. Эмпирическая функция распределения и графическое преставление распеделения частот
- •4. Расчёт числовых характеристик вариационных рядов
- •Приложения Приложение I
- •Приложение II
- •Приложение III
- •Приложение IV Cтатистические таблицы
- •Примечания:1) функция Лапласа и интеграл ошибоксвязаны соотношением; 2)и.
- •Раздел I. Основные методы математической статистики
- •2.2. Методы получения оценок. . . . . . . . 12
- •3. Интервальное оценивание параметров. . . . 15
- •4.3. Проверка гипотез относительно двух выборок. . . . 25
- •4.4. Непараметрические ранговые критерии. . . . . 27
- •5. Основы дисперсионного анализа: однофакторная
- •6.2. Корреляция. . . . . . . . . . 34
- •6.4. Выборочные методы частного и множественного корреляционного
- •1. Общие положения . . . . . . . . . 67
- •2. Алгоритм – формулы расчёта выборок и предлагаемое их
- •Раздел 3. Комментарии и указания к решение типового
- •Часть II
4.4. Непараметрические ранговые критерии.
Определение 4.5. Статистический критерий, распределение которого не зависит от вида или хотя бы параметров распределения основной или альтернативных гипотез, называется непараметрическим.
Часто приходится сравнивать две выборки или две серии независимых наблюдений однородных величин X и Y, причём наблюдённые значения xi и yj дают различные значения выборочных средних () или обнаруживают различные рассеяния (). Возникает вопрос: можно ли считать эти расхождения существенными, значимыми или их следует приписать случайностям выборок.
Основная и альтернативная гипотезы в данном случае могут быть сформулированы как в виде (4.1) или (4.5) так и виде (4.8) и (4.13).
Большинство мощных непараметрических критериев используют статистики, основанные не на самих выборочных наблюдениях, а на так или иначе присвоенных им номерах-рангах, или на значениях сопоставленной им логической переменной. Критерии первого типа называют ранговыми. Многие ранговые критерии, применяемые к решению обозначенных выше задач, по сути своей представляют критерий, предложенный впервые Вилкоксоном.
a. Критерий инверсий Вилкоксона.
Предлагаемый критерий особенно удобен при следующей формулировке нулевой и альтернативной гипотез: H0 – обе выборки извлечены из одной совокупности, т. е. FX = FY (совпадение выборочных распределений); H1: FX < FY или FX > FY .
Критерий основан на числе инверсий, под которыми понимается следующее: наблюдения, полученные в двух выборках, располагаются в общую последовательность в порядке возрастания их значений, например в виде
x1 y1 y2 x2 y3 x3 x4 x5 y4 x6 y5 y6 y7 x7 x8 x9 y8 y9 y10 x10 y11 x11 y12. (4.15)
Если какому либо значению x предшествует некоторый y, то эта пара даёт инверсию (можно наоборот, рассматривать предшествование y –ов x-ам). Статистикой критерия является величина u – общее число инверсий.
Гипотеза H0 отвергается, если число u превосходит выбранную в соответствии с уровнем значимости границу, определяемую из того, что при объёмах выборок m > 10 и n > 10 число инверсий u распределено приблизительно нормально с математическим ожиданием и дисперсией:
Mu = mn /2; Du = mn (m + n + 1)/12. (4.16)
Пример 4.2. В рассмотренной последовательности из двух выборок (4.14) m = 12, n = 11; ux = 2 + 33 + 4 + 37 + 10 + 11 = 57 для x- ов и uy = 21 + 2 + 4 + 5 + 36 + 39 +10 + 11 = 79 для y– ов; Mu = 1211/2 = 66; Du = 121124/12 = 264; σu = (Du)1/2 ≈ 16,25. Зададимся, например, пятипроцентным уровнем значимости (q = 5%; ε = q/100 = 0,05) и по таблице стандартного нормального распределения находим критическое значение tq = 1,96 симметричной двусторонней критической области для гипотезы H0, определяемой уравнением
P{tq} = P {|– Mu | > tqσu}.
Для рассматриваемого примера границы критической области равны:
u1 = 66 – 1,96 16,25 = 34,15 ≈ 34; u2 = 66 + 1,96 16,25 = 97,85 ≈ 98.
Так как ux ; uy (u1, u2) = (34; 98) , то гипотеза H0 не отвергается (нет оснований считать выборочные распределения различными). Вероятность ошибки при этом равна 0,05.
b. Критерии Манна – Уитни и Сиджела – Тьюки.
Рассматриваемые здесь ранговые статистические критерии являются своеобразными модификациями критерия Вилкоксона и используются в задачах проверки гипотез о параметрах распределений.
Критерий Манна- Уитни предназначен для проверки нулевой гипотезы о равенстве выборочных средних значений, т. е. H0: . Точнее: наблюдаемые различия между выборочными средними носят чисто случайный характер, определяемый случайностью эксперимента.
Для получения статистики критерия выборки выстраивают в общую последовательность в порядке возрастания (или убывания) и каждому выборочному значению в этом ряду сопоставляется ранг rk – его номер в этом ряду (k = 1 m + n) Одинаковым выборочным значениям присваивается одинаковый ранг, равный среднему арифметическому из номеров этих значений в общем ряду. Далее считается сумма рангов U величин xi (или yj). Статистика U (для варианты X) удовлетворяет соотношениям
MU = n(m + n + 1)/2; DU = mn (m + n + 1)/12, (4.17)
которые задают параметры нормального распределения при тех же условиях для m и n. Поэтому критическая область для гипотезы H0 строится так, как описано выше. Отметим лишь, что в выражении для MU следует заменить n на m при расчёте статистики критерия для варианты Y.
Критерий Сиджела – Тьюки предназначен для проверки нулевой гипотезы о равенстве выборочных дисперсий, т. е. H0:=против H1:.
Порядок формирования статистики критерия и принятия решения почти совпадают с той же процедурой для критерия Манна – Уитни. Различие состоит лишь в процедуре присвоения номеров (а, значит, и рангов) выборочным значениям, упорядоченным в общем ряду. Первый номер присваивается первому члену ряда; второй и третий – последнему и предпоследнему; четвёртый и пятый – второму и третьему членам ряда и т. д. После этого номера одинаковых по величине вариант усредняются. Сумма полученных при этом рангов для вариант одной из выборок (любой) и составляет статистику U критерия.
Пример 4.3. Рассмотрим те же две выборки, что и в предыдущем примере и полагаем, что последовательность (4.15) выстроена в порядке возрастания и варианты y5 y6 y7 x7 x8 x9 имеют одинаковоё значение. Таблица рангов:
x y y x y x x x y x y y y x x x y y y x y x y
1 2 3 4 5 6 7 8 9 10 13 13 13 13 13 16 17 18 19 20 21 22 23
1 4 5 8 9 12 13 16 17 20 20,6 … 20,6 15 14 11 10 7 6 3 2
Тогда статистика U для элементов выборки X имеет значение: U1 = 120; U2 = 136,2. Величины MxU = 132; MyU = 144; σU ≈ 16,25. Критическое значение tq = 1,96 и обе статистики не превосходят свои верхние критические значения: Uq = 164 в первом и Uq = 176 во втором случаях. Поэтому нулевые гипотезы о равенстве выборочных средних и дисперсий следует в данном случае отвергать нет оснований.