- •Введение
- •1.Общие положения
- •1.1.Тематика курсовых работ
- •1.2.Расчетная часть
- •2. Порядок выполнения расчетов
- •2.2. Построение статистического ряда
- •2.3. Определение оценок числовых характеристик
- •2.4. ИСКЛЮЧЕНИЕ ИЗ МАССИВА ПРОМАХОВ
- •2.5 Определение закона распределения вероятности экспериментальных данных
- •2.5.1. Построение гистограммы
- •2.5.2. Аппроксимация гистограммы и определение аналитического выражения функции плотности распределения вероятности
- •2.6.1. Основные теоретические положения применения критериев согласия при проверке гипотез
- •2.6.3. Критерий согласия А.Н. Колмогорова
- •2.6.4 Критерий согласия К. Пирсона (критерий χ2)
- •2.7.1. Общие сведения о характеристиках положения закона распределения вероятности и их оценках
- •2.7.2. Определение оценки характеристики положения
- •2.7.3. Представление результата измерения
- •Приложение А
- •Приложение Б
Окончание табл. 15
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
32 |
5,6 |
2 |
237 |
0,9875 |
0,926279 |
0,99465 |
0,959111 |
|
33 |
5,7 |
2 |
239 |
0,99583 |
0,939839 |
0,9978 |
0,96863 |
|
34 |
5,8 |
1 |
240 |
1,00000 |
0,949777 |
0,999225 |
0,975933 |
|
В 9-ой колонке табл. 15 представлены три значения Dmax, полученные как модуль максимальной разности между значениями экспериментальной функции распределения вероятности (5-ая колонка) и соответствующей аппроксимирующей функции (используемые значения функций распределения вероятности выделены жирным шрифтом).
По формуле (34) определяем значение λ = D n . Для первой аппроксимирующей функции (трапецеидальный закон) λ1 = 1,2901, для второй (сумма двух квадратичных экспонент) - λ2 = 1,1259, а для третьей
(сумма двух экспонент) - λ12 = 0,8313.
По табл. 14 находим, что P(λ1) ≈ 0,068, P(λ2) ≈ 0,178, P( λ12 ) ≈ 0,5,
таким образом все три гипотезы аппроксимирующих функций можно признать совместимыми с экспериментальными данными по критерию согласия А.Н. Колмогорова.
В данном примере наглядно подтверждается тезис о том, что критерий А.Н. Колмогорова дает завышенные результаты. Но и из полученных данных можно сделать вывод о том, что наиболее совместимым с экспериментальными данными является третья
аппроксимирующая функция распределения вероятности F21 (x) .
2.6.4. Критерий согласия К. Пирсона (критерий χ2)
Критерий согласия К. Пирсона (хи – квадрат) основан на выборе определенной меры расхождения между теоретическим и экспериментальным распределением значений [1].
Допустим,что вся область изменения величины разбита на l интервалов или групп (∆1, ∆2,…∆i……∆l), которые оформлены в виде ряда. При этом считаем, что pi есть вероятность того, что величина принимает значение, принадлежащее i-му множеству ∆i (теоретическая вероятность), а
mi – число значений величины i из общего числа n , попавших в ∆i (получено в результате эксперимента). Тогда должно выполняться условие
p1 + p2 +………..+ pi + ………..+ pl = 1 m1 + m2 + ………+ mi + ……….+ml = n.
Если проверяемая гипотеза верна, то mi представляет частоту появления события, имеющего в каждом из n произведенных испытаний вероятность Рi. Следовательно, можно рассматривать mi как случайную величину, подчиняющуюся биномиальному закону распределения с центром в точке
npi и средним квадратическим отклонением σi = npi (1 − pi ) . Когда n
велико, можно считать, что частота распределена асимптотически нормально с теми же параметрами. При правильности выбранной гипотезы можно ожидать, что будут асимптотически нормально распределены также величины
ξi |
= mi − npi |
i =1,2,.......l , |
|
npi |
|
а в качестве меры расхождения данных выборки m1,m2, … mi …ml с теоретическими данными np1,np2,…..,npi,…..,npl рассматривается величина
|
l |
l |
− npi ) |
2 |
|
|
|
χ2 = ∑ξi2 = ∑(mi |
. |
|
(35) |
||
|
i=1 |
i=1 |
npi |
|
|
|
Если проверяемая простая гипотеза верна, |
то критерийχ2 имеет |
|||||
распределение, |
стремящееся |
при |
n → |
∞ |
к распределениюχ2 . |
|
Распределение |
χ2 зависит от числа степеней свободы, которое в данном |
|||||
случае определяется как разность |
между |
количеством интервалов l и |
числом независимых условий r (наложенных связей).
При проверке гипотезы о законе распределения величины выбирается в уровень значимости q % (обычно от 5 до 10). Пусть χq2 обозначает q% предел для закона χ2 с (l - r) степенями свободы, определяемый по таблицам (см. приложение Б). Если гипотеза верна, то при достаточно большом n приближенно будем иметь
P ( χ2 > χq2 ) = |
|
q |
. |
(36) |
|
100 |
|||||
|
|
|
Определив значение χ2 по данным выборки, получают одно из двух: илиχ2 >χq2 , т.е. критерий попадает в критическую область и тогда
расхождение экспериментальных данных с теоретическим законом распределения существенно, или имеет место неравенство χ2 ≤χq2 , т.е.
расхождение несущественно, а поэтому гипотеза о теоретическом законе распределения вероятности может быть принята. Это правило указывает
на то, что только в q% всех случаев проверки отбрасывается верная гипотеза о теоретическом законе распределения.
Для обоснованного применения критерия согласия χ 2 необходимо
иметь в виду, что при выводе формулы (35) предполагается, что биномиальное распределение частостей в каждом интервале или группе может быть сведено к нормальному. Но соответствующий предельный переход осуществляется достаточно быстро, только если ни одна из вероятностей pi и q не будут малыми. Отсюда следует, что применение критерия согласия будет обоснованным, если ни одна из частостей в любом интервале не будет мала. Поэтому рекомендуется при применении
критерия согласия χ 2 частости крайних интервалов, которые обычно представляют малые значения, объединять между собой, чтобы, как условились, частость объединенного интервала была не меньше 5.
Таблица значений χ 2 , соответствующих определенным вероятностям P(χ2 ) и различным числам степеней свободы (l - r) для критерия К. Пирсона, дана в приложении Б.
ПРИМЕР. Применим критерий К. Пирсона для проверки гипотез о законах распределения в нашем примере для всех трех аппроксимирующих функций. Результаты расчетов будут представлены в виде таблиц. Необходимо учесть, что при применении критерия согласия К. Пирсона под теоретической вероятностью pi понимается вероятность попадания отсчета в заданный интервал, рассчитанная с помощью аппроксимирующей функции. Т.е. при строгом подходе необходимо интегрировать аппроксимирующую функцию плотности распределения вероятности в каждом интервале, на которые разделен весь массив при построении гистограммы:
Qпр |
Qлев |
Qпр |
|
Р(Qлев≤ Q ≤ Qпр ) = ∫P(Q)dQ − ∫ |
P(Q)dQ = |
∫P(Q)dQ |
|
−∞ |
−∞ |
|
Qлев |
где Qлев и Qпр – соответственно левая и правая границы интервала. К этому следует добавить, если аппроксимирующая функция плотности распределения вероятности имеет точку (несколько точек), в которой производной не существует, то необходимо учитывать особый характер этой точки (этих точек) и расчеты вероятности попадания в данный интервал целесообразно проводить в несколько этапов: рассчитывать вероятности попадания отсчетов в подынтервалы до особой точки и после нее. Сумма вероятностей в подынтервалах будет равна вероятности попадания отсчетов в интервал с особой точкой.
Прежде чем переходить к расчетам, определим число степеней свободы. В гистограмме 1 число интервалов 5, а связей, накладывающих ограничения, две (средние значения полигона распределения и аппроксимирующей функции должны быть равны; суммарная вероятность должна быть равна единице); в гистограмме 3 количество интервалов 15 и накладывалось три ограничения (суммарная вероятность равна единице; средние значения полигона распределения и аппроксимирующей функции должны быть равны; экстремальные значения полигона распределения и аппроксимирующей функции должны быть при одинаковых значениях отсчетов). Таким образом, в первом случае число степеней свободы должно быть r = 3, а во втором - r = 12.
1. Распределение, аппроксимирующая функция которого описывается трапецеидальным законом
Если учесть, что аппроксимирующая функция пересекает ось абсцисс при Qн ≈ 2,3757 и Qк ≈ 6,02435 (что определяется довольно просто), то теоретическую вероятность попадания в каждый из пяти интервалов рассчитываем по формулам
2,9625 |
|
3,375 |
|
3,7875 |
|
|
4,6125 |
|
|
||||||
P1 = |
∫(aQ −b)dQ ; |
P2 = ∫(aQ −b)dQ + |
∫cdQ ; |
P3 |
= ∫cdQ ; |
||||||||||
2,3757 |
|
2,9625 |
|
3,375 |
|
|
3,7875 |
|
|
||||||
|
|
5,025 |
5,4375 |
|
6,02435 |
|
|
|
|
|
|||||
|
|
|
P4 = ∫cdQ + ∫(−aQ +b)dQ ; P5 = |
∫(−aQ +b)dQ |
|
|
|||||||||
|
|
4,6125 |
5,025 |
|
5,4375 |
|
|
|
|
|
|||||
Результаты вычислений сведены в табл. 16. |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
Таблица 16 |
|
|
||
|
|
|
Значения |
|
Теорети- |
Кол-во |
|
|
|
|
|
|
|
||
|
№ |
|
границ |
|
ческая |
отсчетов |
|
|
|
|
(mi −npi ) |
2 |
|
||
|
|
интервалов |
|
в интер- |
|
|
|
|
|
|
|||||
|
п/п |
|
|
|
|
вероят- |
вале |
|
|
npi |
|
|
np |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
Qлев |
Qпр |
|
ность |
mi |
|
|
|
|
|
i |
|
|
|
|
|
|
pi |
|
|
|
|
|
|
|
|
|||
|
1 |
|
2 |
3 |
|
4 |
5 |
|
|
6 |
|
7 |
|
|
|
|
1 |
|
-∞ |
2,9625 |
|
0,062368 |
14 |
|
|
14,96832 |
0,062639 |
||||
|
2 |
|
2,9625 |
3,7875 |
|
0,267827 |
78 |
|
|
64,2785 |
2,929112 |
||||
|
3 |
|
3,7875 |
4,6125 |
|
0,29865 |
53 |
|
|
71,676 |
4,866245 |
||||
|
4 |
|
4,6125 |
5,4375 |
|
0,267833 |
84 |
|
|
64,2785 |
6,049822 |
||||
|
5 |
|
5,4375 |
∞ |
|
0,062376 |
11 |
|
|
14,96832 |
1,052957 |
||||
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
χ 2 = 14,96077 , число степеней свободы 5 – 2 = 3. |
|
|
Из таблицы для распределения χ2 (приложение Б) |
находим, |
что для |
уровня значимости q = 5% при числе степеней свободы 3 |
χq2= 7,8, |
χ 2 >χq2, |
т.е. гипотеза о законе распределения вероятности не подтверждается по критерию согласия Пирсона.
2. Распределение, состоящее из суммы двух квадратичных экспонент Здесь расчет вероятностей попадания отсчетов в интервал производится по разности функций распределения вероятности, которые определяются аналогично расчетам, приведенным в разделе 2.5.1
(применение критерия согласия Мозеса):
Qiпп |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р2i = ∫ (А1е−α1 (Q−Q1 )2 + А2 е−α2 (Q−Q2 )2 )dQ = |
||||||||||||||||||||
Qiлле |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
2 |
|
|
|
t2iпп |
|
|
t2 |
|||||
π |
|
|
1 |
1iпп |
|
|
− |
t1 |
|
1 |
|
∫0 |
|
|
− |
2 |
|
|||
|
|
∫0 |
|
|
|
|
|
|
|
|
|
|||||||||
= A1 α1 |
|
( |
2π |
|
e |
|
2 dt1 + |
2π |
|
e |
|
2 dt2 )- |
||||||||
- A1 α1 |
|
( |
t |
∫0 |
e |
|
t2 |
21π |
t |
∫0 |
e |
|
t2 |
|||||||
21π |
|
2 dt1 + |
|
|
2 dt2 ), |
|||||||||||||||
π |
|
|
1iлле |
|
|
− |
1 |
|
|
|
|
2iлле |
|
− |
2 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
где t1i= 2α1 (Q −3,492) |
, |
t2i= |
|
|
2α2 (Q − 4,908) |
, при этом интеграл |
вероятности определяется в соответствии с рекомендациями, перечисленными в п. 2.5.1. В соответствии с этими рекомендациями (количество отсчетов в интервале должно быть не менее пяти) число интервалов уменьшено до тринадцати за счет объединения двух первых и двух последних интервалов (в первом интервале было два отсчета, а в последнем – один). Соответственно уменьшилось до 10 и число степеней свободы. Результаты расчетов приведены в табл. 17.
Таблица 17
|
Значения |
Теорети |
Кол-во |
|
|
|
|
|
|
|
границ |
- |
отсчет |
|
|
(m −np)2 |
|||
№ |
интервалов |
ческая |
ов |
|
|
||||
|
|
в интер- |
npi |
|
i |
i |
|||
п/п |
Qлев |
Qпр |
вероят- |
|
|
np |
|
||
|
ность |
вале |
|
|
|
i |
|||
|
|
|
|
|
|
|
|
||
|
|
|
pi |
mi |
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
|
|
7 |
|
1 |
- ∞ |
2,902 |
0,0125 |
14 |
3 |
40,33333 |
|
||
2 |
2,902 |
3,138 |
0,0475 |
11 |
11,4 |
0,014035 |
|
||
3 |
3,138 |
3,374 |
0,11225 |
23 |
26,94 |
0,576229 |
|
||
4 |
3,374 |
3,61 |
0,155505 |
36 |
37,32 |
0,046772 |
|
||
5 |
3,61 |
3,846 |
0,112345 |
17 |
26,96 |
3,681271 |
|
||
6 |
3,846 |
4,082 |
0,04915 |
16 |
11,8 |
1,498272 |
|
Окончание табл. 17
1 |
2 |
3 |
4 |
5 |
6 |
7 |
7 |
4,082 |
4,318 |
0,0215 |
11 |
5,16 |
6,609612 |
8 |
4,318 |
4,554 |
0,04915 |
10 |
11,8 |
0,27345 |
9 |
4,554 |
4,79 |
0,112345 |
17 |
26,96 |
3,681271 |
10 |
4,79 |
5,026 |
0,155505 |
39 |
37,32 |
0,075517 |
11 |
5,026 |
5,262 |
0,11225 |
18 |
26,94 |
2,966726 |
12 |
5,262 |
5,498 |
0,0475 |
17 |
11,4 |
2,750877 |
13 |
5,498 |
+ ∞ |
0,0125 |
11 |
3 |
21,33333 |
Суммируя последнюю графу табл. 17, |
получаем значение |
χ 2 = |
83,8407, Из таблицы для распределения |
χ2 (приложение Б) находим, что |
для уровня значимости q = 5% при числе степеней свободы 10 (13-3) χq2 = 18,3, χ 2 > χq2, т.е. гипотеза о законе распределения вероятности не подтверждается по критерию согласия Пирсона.
3. Распределение, состоящее из суммы двух экспонент Расчет вероятностей попадания отсчетов в интервал производится
по разности функций распределения вероятности, которые определяются аналогично расчетам, приведенным в разделе 2.5.1 ( применение критерия согласия Мозеса):
хпр
P21i = ∫ (А11е−α11 х−х1 + А21е−α12 х−х2 )dx
xлев
Вдиапазоне от -∞ до Q =3,492 значение Р21i определяется по формуле
|
|
|
A1 |
|
e |
−α1 |
(Q −Q) |
+ |
|
|
A1 |
e |
−α1 |
(Q −Q) |
|
|
Qпр |
||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
Р21i = |
|
|
|
1 |
|
1 |
|
1 |
|
|
|
2 |
|
2 |
2 |
|
|
|
, |
||||||
α |
1 |
|
|
α |
1 |
|
|||||||||||||||||||
|
|
1 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
Qлев |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
в диапазоне от Q =3,492 до Q = 4,908 - по формуле |
|
|
|
||||||||||||||||||||||
1 |
|
|
|
A1 |
|
−α1 |
(Q−Q ) |
|
|
|
A1 |
|
−α1 (Q −Q ) |
|
Qпр |
||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Р2i |
= |
|
|
1 |
e |
|
1 |
1 |
+ |
|
|
|
2 |
|
e |
2 |
2 |
|
, |
||||||
α |
1 |
|
|
α |
1 |
||||||||||||||||||||
|
|
|
|
1 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
Qлев |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в диапазоне от х = 4,908 до +∞ - по формуле
|
|
1 |
|
|
|
1 |
|
|
Qпр |
|
|
|
|
|
|
||||
Р21i = |
A1 |
e−α11 |
(Q−Q1 ) + |
A2 |
e−α12 (Q−Q2 ) |
|
. |
||
1 |
1 |
||||||||
|
α |
1 |
|
|
α |
2 |
|
|
Qлев |
|
|
|
|
|
|
|
В расчетах учитываем, что при Q1 = 3,492 и Q2 = 4,908 интеграл меняет знак на противоположный, поэтому интегрирование в интервалах, в которые попадают эти значения, целесообразно осуществлять в три этапа:
а) определяется вероятность попадания отсчета в подынтервал от
Qлев доQ1 = 3,492 (или Q2 = 4,908 ),
б) определяется вероятность попадания отсчета в подынтервал от
Q1 = 3,492 до Qпр, (или от Q2 = 4,908 до хпр),
в) определяется вероятность попадания отсчета в интервал, как
сумма вероятностей попадания отсчета в подынтервалы. |
|
|
|||||||
Результаты расчетов приведены в табл. 18. |
Таблица |
18 |
|
||||||
|
|
|
|
|
|
|
|||
|
|
Значения |
Теорети |
Кол-во |
|
|
|
|
|
|
|
границ |
- |
отсчет |
|
|
(mi −npi )2 |
||
|
№ |
интервалов |
ческая |
ов |
|
|
|||
|
п/п |
|
|
вероят- |
в интер- |
npi |
|
|
|
|
|
|
npi |
|
|||||
|
|
Qлев |
Qпр |
ность |
вале |
|
|
|
|
|
|
|
|
pi |
mi |
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
|
7 |
|
|
1 |
- ∞ |
2,902 |
0,053578 |
14 |
12,86 |
|
0,101295 |
|
|
2 |
2,902 |
3,138 |
0,04656 |
11 |
11,174 |
|
0,002718 |
|
|
3 |
3,138 |
3,374 |
0,087019 |
23 |
20,885 |
|
0,214255 |
|
|
4 |
3,374 |
3,61 |
0,137988 |
36 |
33,12 |
|
0,250946 |
|
|
5 |
3,61 |
3,846 |
0,091993 |
17 |
22,08 |
|
1,168058 |
|
|
6 |
3,846 |
4,082 |
0,058516 |
16 |
14,044 |
|
0,272506 |
|
|
7 |
4,082 |
4,318 |
0,048681 |
11 |
11,68 |
|
0,039978 |
|
|
8 |
4,318 |
4,554 |
0,058516 |
10 |
14,044 |
|
1,164344 |
|
|
9 |
4,554 |
4,79 |
0,091993 |
17 |
22,08 |
|
1,168058 |
|
|
10 |
4,79 |
5,026 |
0,137988 |
39 |
33,12 |
|
1,045003 |
|
|
11 |
5,026 |
5,262 |
0,087019 |
18 |
20,885 |
|
0,398441 |
|
|
12 |
5,262 |
5,498 |
0,04656 |
17 |
11,174 |
|
3,037237 |
|
|
13 |
5,498 |
+ ∞ |
0,053579 |
11 |
12,86 |
|
0,268721 |
|
Суммируя последнюю графу табл. |
18, получаем значение χ2 |
= |
9,13156. |
Из таблицы для распределения |
χ 2 (приложение Б) находим, что для |
||
уровня значимости q = 5% при числе степеней свободы 10, |
χq2 |
= 18,3, |