Курсовик «методы Обработки Экспериментальных Данных» По Математической Статистике (Джваршейшвили И. А
.).pdf5. Построение гипотезы о распределении с помощью критерия согласия Пирсона.
Применим критерий Пирсона к сгруппированным данным. Запишем в таблице 4 интервальные распределения, пригодные для
непосредственного применения критерия Пирсона: Таблица 4
zi−1 ; |
- ;9,4 |
9,4;9,6 |
9,6;9,8 |
9,8;10 |
10;10,2 |
10,2;10, |
10,4;10, |
10,6;10, |
10,8;11 |
11;+ |
|
|
|
|
|
4 |
6 |
8 |
|
|
|
i |
5 |
6 |
8 |
13 |
17 |
18 |
15 |
11 |
8 |
9 |
5.2.Вычисление теоретических частот.
Здесь принята гипотеза о нормальном распределении случайной величины. В этом случае теоретические вероятности вычисляются по формуле
pi=Ф0 zi−x −Ф0 zi−1−x , S S
где:
x |
- выборочная средняя; |
||||
|
|
|
|
|
|
S – исправленная выборочная дисперсия; |
|||||
|
|
1 |
0 |
||
Ф0 |
x = |
|
∫e−z 2/2 dz - функция Лапласа. |
||
|
|
|
|||
|
|
2 |
x |
Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице 5.
Таблица 5
n=110 λ=0,26 x0=10,27
концы |
ui−1= |
ui= |
|
|
|
Pi = |
|
i = |
||
проме- |
|
|
|
|
||||||
zi−1−x0 ; |
zi −x0 ; |
e−ui−1 |
e−ui |
|
|
|||||
жутков |
e |
−ui−1 |
−e |
−ui |
||||||
|
|
при x0 zi−1 |
при x0 zi |
|
|
|
|
n Pi |
||
zi −1 |
zi |
|
|
|
|
|||||
|
|
|
|
|
|
|
||||
- |
9,4 |
0,00 |
1,4 |
1,0000 |
0,2470 |
|
0,7530 |
|
82,84 |
|
9,4 |
9,6 |
1,40 |
1,44 |
0,2470 |
0,2368 |
|
0,0102 |
|
1,12 |
|
9,6 |
9,8 |
1,44 |
1,48 |
0,2368 |
0,2271 |
|
0,0097 |
|
1,07 |
|
|
|
|
|
|
|
|
|
|
|
|
9,8 |
10 |
1,48 |
1,52 |
0,2271 |
0,2177 |
|
0,0093 |
|
1,03 |
|
10 |
10,2 |
1,52 |
1,57 |
0,2177 |
0,2088 |
|
0,0090 |
|
0,98 |
|
|
|
|
|
|
|
|
|
|
|
|
10,2 |
10,4 |
1,57 |
1,61 |
0,2088 |
0,2002 |
|
0,0086 |
|
0,94 |
|
|
|
|
|
|
|
|
|
|
|
|
10,4 |
10,6 |
1,61 |
1,65 |
0,2002 |
0,1919 |
|
0,0082 |
|
0,91 |
|
10,6 |
10,8 |
1,65 |
1,69 |
0,1919 |
0,1840 |
|
0,0079 |
|
0,87 |
|
|
|
|
|
|
|
|
|
|
|
|
10,8 |
11 |
1,69 |
1,73 |
0,1840 |
0,1765 |
|
0,0076 |
|
0,83 |
|
11 |
+ |
1,73 |
+ |
0,1765 |
0,0000 |
|
0,1765 |
|
19,41 |
∑: |
1,0000 |
110 |
|
|
Значение функции |
Ф0 |
x при различны x находятся по таблицамБ |
||||||
имеющимся практически в любом руководстве по теории вероятностей; при |
|||||||||
этом следует учесть, что |
Ф0 −x =−Ф0 x и при |
x 4 можно принять |
|||||||
Ф0 |
x 0,5 . |
|
|
|
|
|
|
|
|
|
В качестве функции Лапласа берется интеграл |
||||||||
|
|
|
|
|
1 |
|
x |
|
|
|
|
|
|
Ф x = |
|
−∞∫ e−z2 /2 dz |
|
||
|
|
|
|
|
|
|
|
||
|
|
|
|
2 |
|
||||
|
и приводятся таблицы его значений. Формула для подсчета Pi остается |
||||||||
верной, если в ней Ф0 заменить на Ф. |
|
||||||||
|
5.3. |
Статистика |
x2 и вычисление её значения по опытным |
||||||
|
данным. |
|
|
|
|
|
|
|
Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая величина, характеризующая степень расхождения теоретического (предполагаемого) и статического распределений.
В критерии Пирсона в качестве такой меры расхождения используется величина:
X2=∑ i− 'i 2
i ' i
называемая статистикой «хи-квадрат» или статистикой Пирсона.
Вычислим значение x2 для нашего варианта; это значение, найденое по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать
через x2набл
Таблица 6
i |
i |
' |
− ' |
i |
2 |
/ ' |
|
|
i |
i |
|
i |
|
1 |
5 |
82,840 |
73,14 |
|
||
|
|
|
|
|
||
2 |
6 |
1,120 |
21,26 |
|
||
|
|
|
|
|
||
3 |
8 |
1,070 |
44,88 |
|
||
4 |
13 |
1,030 |
139,11 |
|
||
|
|
|
|
|
||
5 |
17 |
0,980 |
261,88 |
|
||
6 |
18 |
0,940 |
309,62 |
|
||
|
|
|
|
|
||
7 |
15 |
0,910 |
218,16 |
|
||
8 |
11 |
0,870 |
117,95 |
|
||
|
|
|
|
|
||
9 |
8 |
0,830 |
61,94 |
|
||
10 |
9 |
19,410 |
5,58 |
|
||
|
|
|
|
|
|
|
∑: |
110 |
110 |
1247,95 |
|
X2набл=1247,95
5.4.Распределение статистики x2
Начнем мы с несколько отвлеченного определения. Говорят, что случайная величина имеет x2 -распределение с r степенями свободы (r=1; 2; 3; …) , если ее плотность имеет вид
k r x ={0cr xr/2−1 e−x /2 |
приприxx≤0,0,} ; |
где cr - некоторая положительная постоянная ( cr определяется из
∞
равенства −∞∫ kr x dx=1 . Случайная величина, имеющая распределение
x2 с r степенями свободы, будет обозначаться через x2r .
Для дальнейшего изложения важно лишь отметить, что, во-первых, распределение x2 определяется одним параметром — числом r степеней свободы и, во-вторых, существуют таблицы, позволяющие приближенно найти вероятность попадания значений случайной величины x2r в любой промежуток.
Вернемся теперь к статистике x2=∑ i − 2i / 2i . Отметим, что она
i
является случайной величиной, поскольку зависит от результатов наблюдений
и, следовательно, в резличных сериях опытов принимает различные, заранее не известные значения. Понятно, кроме того, что закон распределения
статистики x2 зависит: 1) от действительного (но неизвестного нам)) значения распределения случайной величины, измерения которой осуществляется (им определяется эмпирические частоты 1 ); 2) от количества произведенных наблюдений и от способа разбиения числовой оси
на промежутки от теоретического закона распределения изучаемой случайной величины.
Если выдвинутая гипотеза верна, то, очевидно, закон распределения
измеряемой случайной величины, от числа n и от выбора промежутков разбиения. Но на самом деле, в этом случае справедливо куда более сильное утверждение. А именно, при достаточно больших n закон распределения
статики x2 практически не зависит ни от закона распределения изучаемой случайной величины и ни от количества n произведенных опытов. Эта теорема объясняет, почему статистика Пирсона обозначается через x2 .
Если в качестве предпологаемого выбрано одно из трех основных непрерывных распределений (нормальное, показательное или равномерное), то r=l-3, где l — количества промежутков, на которые разбита числовая ось. В общем случае
r =l−N пар−1,
где N пар - количество параметров предполагаемого распределения, которые заменены вычисленными по опытным данным оценками.
5.5. Правило проверки гипотезы о законе распределения случайной величины.
x2=∑ i− 2i / 2i принимает i
только неотрицательные значения, причем в нуль она обращается в одном-
единственном случае — присовпадении всех соответствующих эмпирических и
теоретических частот (то есть при i = 'i для каждого i).
Если выдвинутая гипотеза о законе распределения изучаемой случайной величины соответствует действительности, то эмпирические и теоретические частоты должны быть примерно одинаковы, а значит, значения статистически
z2 будут группироваться около нуля. Если же выдвинутая гипотеза ложна,
то эмпирические и соответствующие теоретические частоты будут существенно разниться, что приведет к достаточно большим отклонениям от
нуля значений x2 .
Поэтому хотелось бы найти тот рубеж — называемый критическим
значением (или критической точкой) и обозначаемый через |
x2крит , который |
|
разбил бы всю область возможных значений статистики x2 |
на два не |
|
пересекающихся подмножества (рис.4): область принятия гипотезы, |
||
характеризующуюся неравенством x2 x2 |
крит , и критическую область , |
определяемую неравенством x2 x2 |
крит. |
рис. 4
|
рис. 5 |
|
|
|
|
|
|
Как же найти критическое значение x2крит |
? |
|
|
|
|
|
Если выдвинутая гипотеза о законе распределения изучаемой случайной |
|||||
величины верна, то вероятность попадания значений статистики |
x2 |
в |
||||
критическую область должна быть мала, так что событие ( |
x2≥ x2 |
крит |
) |
|||
должнобыть практически неосуществимым в единичном испытании. Эта |
||||||
вероятность, обозначим ее через α: |
|
|
|
|
|
|
|
=P x2≥x2крит |
, |
|
|
|
|
называется уровнем значимости. |
x2 |
|
|
|
|
|
|
Чтобы определить критическое значение |
крит , поступим следующим |
||||
образом. Зададим какое-либо малое значение уровня значимости α и найдем |
||||||
x2 |
крит как корень уравнения |
|
|
|
|
|
|
P x2≥x = |
|
|
x2 близко при |
||
с неизвестной x. Поскольку распределение статистически |
||||||
n ∞ к x2 -распределению с r степенями свободы, то |
|
|
|
|||
|
P x2≥x =P x2r ≥x , |
|
|
|
и приближенное значение x2крит можно найти из уравнения
∞
P x2r x = ∫ kr t dt= .
x
Геометрические соображения показывают, что последнее уравнение
имеет единственное решение: его корень — это такое число x>0, при котором площадь под графиком функций k r t (плотности x2 -распределения) над
участком (x; + ) равна α (рис. 5). На практике решение последнего уравнения находят с помощью специальных таблиц. Эти таблицы позволяют по двум входным параметрам — уровню значимости α и числу степеней свободы r
определить критическое значение x2крит .
Подводя итоги, сформулируем правило проверки гипотезы о законе распределения случайной величины с помощью x2 -критерия Пирсона:
1.Проводят n независимых наблюдений случайной величины;
2.Разбивают всю числовую ось на несколько промежутков
|
−∞ ; z1 , [ z1 |
; z2 ) , [ z2 |
; z3 ) , ... , [ zl−1 ; ∞ ) ; |
|
|
так, чтобы количество результатов измерения в каждом из них оказалось |
|||
3. |
не менее пяти. |
|
|
|
Выдвигают гипотезу о законе распределения изучаемой случайной |
||||
|
величины и находят параметры этого закона; |
|||
4. |
С помощью предполагаемого (теоретического) распределения находят |
|||
|
теоретические вероятности |
Pi и теоретические частоты 'i=npi |
||
|
попадания значений случайной величины в i-й промежуток; |
|||
5. |
По эмпирическим и теоретическим частотам вычисляют значение |
|||
6. |
статистики x2 , обозначаемое через |
x2набл . |
||
Определяют число r степеней свободы. |
||||
7. |
Используя заданное значение уровня значимости α и найденное число |
|||
8. |
степеней свободы r, по таблице находят критическое значение x2крит . |
|||
Формулируют вывод, опираясь на основной принцип проверки |
||||
|
статистических гипотез: |
|
|
|
|
- если наблюдаемое значение критерия принадлежит критической |
|||
|
области, то есть если |
x2набл ≥x2крит |
, то гипотезу отвергают как плохо |
|
|
согласующуюся с результатами эксперимента; |
|||
|
- если наблюдаемое значение критерия принадлежит области принятия |
|||
|
гипотезы, то есть x2 |
набл x2крит , то гипотезу принимают как не |
||
|
противоречащую результатам эксперимента. |
5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в примерах.
Правило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины для нашего варианта реализовано в таблице 7
Таблица 7
Название величины |
Обозначение и числовое значение |
|
величины |
Уровень значимости (задан в условии) |
α=0,05 |
|
|
Количество промежутков разбиения |
l=10 |
|
|
Число степеней свободы |
r=7 r=l-3 |
|
|
Критическое значение (находится по |
xкрит2 =14,07 |
таблице) |
|
Наблюдаемое значение критерия |
xнабл2 =1247,95 |
Гипотеза НЕ ПРИНИМАЕТСЯ т.к. x2набл x2крит .
ЗАМЕЧАНИЯ: 1) Заданное значение уровня значимости α=0,05 означает,
что
P x2 x2крит ≈ =0,05
то есть вероятность события { x2≥x2крит } очень мала, однако это событие,
обладая нулевой вероятностью, все же может осуществиться, и тогда будет отвержена правильная гипотеза. Отвержение гипотезы когда она верна
называется ошибкой первого рода. Таким образом, уровень значимости α — это
вероятность ошибки первого рода. Отметим, что ошибкой второго рода называется принятие гипотезы в случае, когда она неверна.
2) Иногда вместо уровня значимости α задается надежность γ:
=P x2 x2крит
то есть - это вероятность попадания значений статистики x2 в области принятия гипотезы. Поскольку события
{ x2 x2крит } и |
{ x2 x2крит } |
|
противоположны, то |
|
|
P x2 X 2 |
крит =1−P x2 x2крит =1− . |