- •И математической статистике
- •Часть II основные методы математической статистики
- •Владивосток
- •Раздел I основные методы математической статистики
- •1. Генеральная совокупность и выборка
- •1.1 Выборочный метод. Первичная обработка выборочных (экспериментальных) данных.
- •1.2 Выборочные числовые характеристики.
- •Которая называется выборочным средним.
- •2. Точечное оценивание параметров распределений
- •2.1 Свойства оценок; неравенство Крамера – Рао.
- •2.2 Методы получения оценок.
- •3. Интервальное оценивание параметров
- •3.1. Необходимые понятия и функции распределения
- •1) 2) 3)Независимы.
- •3.2 Интервальное оценивание параметров.
- •3.3 Оценки параметров нормального распределения.
- •3.4 Интервальное оценивание параметров распределений, отличных от нормального
- •4.1. Основные определения и используемые понятия.
- •4.2. Критерии согласия
- •1). Критерий Колмогорова
- •2). Критерий хи-квадрат Пирсона
- •3). Критерий Смирнова – Мизеса (критерий ω2)
- •4.3. Проверка гипотез относительно двух выборок
- •4.4. Непараметрические ранговые критерии.
- •5. Дисперсионный анализ: однофакторная модель.
- •6. Элементы прикладного корреляционного анализа
- •6.1. Введение: основные задачи, понятия и терминология.
- •6.2. Корреляция
- •6.3. Ранговая корреляция и сопряжённость
- •6.4.* Выборочные методы частного и множественного
- •Заключение
- •Разлел II вариаты практических заданий
- •1. Общие положения.
- •2. Алгоритмы – формулы расчёта выборок и предлагаемое их
- •Раздел III
- •1. Табулирование данных
- •2. Построение интервального вариационного ряда
- •3. Эмпирическая функция распределения и графическое преставление распеделения частот
- •4. Расчёт числовых характеристик вариационных рядов
- •Приложения Приложение I
- •Приложение II
- •Приложение III
- •Приложение IV Cтатистические таблицы
- •Примечания:1) функция Лапласа и интеграл ошибоксвязаны соотношением; 2)и.
- •Раздел I. Основные методы математической статистики
- •2.2. Методы получения оценок. . . . . . . . 12
- •3. Интервальное оценивание параметров. . . . 15
- •4.3. Проверка гипотез относительно двух выборок. . . . 25
- •4.4. Непараметрические ранговые критерии. . . . . 27
- •5. Основы дисперсионного анализа: однофакторная
- •6.2. Корреляция. . . . . . . . . . 34
- •6.4. Выборочные методы частного и множественного корреляционного
- •1. Общие положения . . . . . . . . . 67
- •2. Алгоритм – формулы расчёта выборок и предлагаемое их
- •Раздел 3. Комментарии и указания к решение типового
- •Часть II
3). Критерий Смирнова – Мизеса (критерий ω2)
В качестве меры расхождения эмпирической F*(x) и гипотетической F(x) функций распределения рассматривается средний квадрат отклонения по всем возможным значениям случайной величины, что влечёт потерю некоторой информации по сравнению с критерием Колмогорова. Итак, выборочная статистика имеет вид
ω2 = =(4.4)
Так как эмпирическая функция распределения F*(x) или Fn (x) является несмещённой оценкой теоретического распределения, т.е. M[F*(x)] = F(x), а дисперсия D[F*(x)] = F(x)(1 – F(x)), то, при выполнении нулевой гипотезы согласия, среднее значение и дисперсия статистики ω2 равны: M[ω2] = 1/6n; D[ω2] = (4n – 3) /180n3; не зависят от гипотетического распределения и в асимптотике равны нулю. Удобнее использовать статистику Z = n ω2, для которой M[Z] = 1/6. По сравнению с распределением Колмогорова распределение статистики Z довольно быстро сходится к предельному распределению (уже при n ≥ 40 они практически совпадают), которое табулирована. В Приложении III в таблице 1 приведены некоторые критические значения для распределения Z. Нулевая гипотеза отвергается с уровнем доверия γ при превышении выборочной статистики критерия над критическим значением.
4.3. Проверка гипотез относительно двух выборок
а. Критерий Колмогорова – Смирнова однородности двух выборок.
Пусть X = (x1, …, x n) F; Y = (y1, …, y m) G, где F и G – непрерывные функции распределения.
Проверяется гипотеза
H 0 : F = G против H1 : F ≠ G. (4.5)
Предлагаемый критерий – асимптотический с уровнем значимости 1– ε.
Замечание 4.6. Если проверяемая гипотеза о двух выборках имеет вид (4.5), то есть проверяется гипотезао совпадении двух распределений, то критерии, привлекаемые для её решения, называюткритериями однородности. Но нередко в задаче о двух выборках проверяется гипотезао совпадении тольконекоторых параметров распределений.
Пусть Fn и Gm – эмпирические функции распределения, построенные по выборкам X и Y соответственно. Введём величину
. (4.6)
Если верна гипотеза H 0 , то при увеличении объёмов выборок эмпирические функции распределения сходятся по вероятности к общему пределу, то есть Dn,m 0. То, с какой скоростью это происходит, показывает следующая теорема (без доказательства).
Теорема Колмогорова –Смирнова. Пусть верна гипотеза H 0 и общая функция распределения двух выборок непрерывна. Тогда для любого y > 0 при n → ∞, m → ∞ .
Пусть q таково,что K (q) = 1 – ε. Положим критическое множество
, (4.7)
то есть мы отвергаем гипотезу об однородности, если расхождение между двумя эмпирическими функциями распределения достаточно велико. При больших n вероятность ошибки 1-го рода α =≈1–K(q) ≈ ε.
b. Проверка гипотез о совпадении параметров распределений.
Рассмотрим задачу проверки согласия двух распределений, представленных своими выборками, на основе сравнения некоторых параметров этих распределений. Вообще говоря, все параметры практически употребляемых распределений выражаются через свои первые четыре момента. Однако, задача статистического сопоставления произвольных распределений даже на уровне двух первых моментов (проблема Беренса – Фишера) до сих пор не имеет общего решения. Поэтому далее предполагаем, что обе выборки извлечены из нормальных распределений, параметры которых, однако, неизвестны. К тому же, данная ситуация на практике встречается наиболее часто.
Проверка гипотезы о совпадении средних.
Особенно часто в приложениях встаёт вопрос о сравнении центров распределения двух нормально распределённых величин ξ и η. В таком случае полагаем (по основной гипотезе),что выборки X и Y извлечены из нормально распределённой генеральной совокупности.
В данном случае проверяется гипотеза
H 0 : m1 = m2 против H1 : m1 ≠ m2. (4.8)
При этом предполагается, что дисперсии теоретических распределений совпадают, хотя и не известны: неизвестно.
Для построения критерия используем выборочные средние и дисперсии
.
В силу того, что инезависимы и распределены нормально:
N(m1, σ2/n) = ; N(m2, σ2/m) = ,формируем на их основе статистику, имеющую стандартное нормальное распределение:
Z = [–– (m1 – m2)]/{σ2(1/n + 1/m)}1/2 N(0, 1). (4.9)
Также по свойству выборок из нормального распределения
nSX2/σ12 ; mSY2/σ22 , (4.10)
причём эти случайные величины независимы, т. к. построены по независимым выборкам. Далее, по свойству распределения хи-квадрат, статистика
S2 = (nSX2 – mSY2) / [σ2(n + m – 2)] (4.11)
не зависит –и распределена похи-квадрат с (n + m – 2) степенями свободы. Таким образом, если верна гипотеза H0 , то статистика
ψ = Z /S = (4.12)
имеет распределение Стьюдента с (n + m – 2) степенями свободы. По таблице распределения Стьюдента находим величину q такую, что (–q) =ε/2.Тогда P{–q < ψ <q } = (q) –(–q) = 1 –ε.Вероятность ошибки первого рода α = P{(x1, …, xn; y1, …, ym) Κ} = ε, где критическая область
Κ = {(x1, …, xn; y1, …, ym) : | ψ | ≥ q }.
Проверка гипотезы о совпадении дисперсий.
Здесь проверяется основная гипотеза
H0 : σ12 = σ22 против H1 : σ12 ≠ σ12 . (4.13)
Из величин (4.9) можно построить случайную величину
η = nSX2/(n – 1)σ12 : mSY2/(m – 1)σ22 = , (4.14)
имеющую распределение Фишера. С помощью таблиц этого распределения находят числа q1 и q2 такие, что (q1) =ε/2; (q2) =ε/2. Тогда
P{q1 < η <q2 } = (q2)–(q1)= 1 – ε.Гипотеза H0 отвергается, если η (q1 , q2). Вероятность этого события (в предположении верности гипотезы H0) в точности равна ε. Критическая область Κ = {(x1, …, xn; y1, …, ym) : η (q1 , q2)}.