Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
189.pdf
Скачиваний:
27
Добавлен:
02.04.2015
Размер:
4.84 Mб
Скачать

Окончание табл. 15

1

2

3

4

5

6

7

8

9

32

5,6

2

237

0,9875

0,926279

0,99465

0,959111

 

33

5,7

2

239

0,99583

0,939839

0,9978

0,96863

 

34

5,8

1

240

1,00000

0,949777

0,999225

0,975933

 

В 9-ой колонке табл. 15 представлены три значения Dmax, полученные как модуль максимальной разности между значениями экспериментальной функции распределения вероятности (5-ая колонка) и соответствующей аппроксимирующей функции (используемые значения функций распределения вероятности выделены жирным шрифтом).

По формуле (34) определяем значение λ = D n . Для первой аппроксимирующей функции (трапецеидальный закон) λ1 = 1,2901, для второй (сумма двух квадратичных экспонент) - λ2 = 1,1259, а для третьей

(сумма двух экспонент) - λ12 = 0,8313.

По табл. 14 находим, что P(λ1) 0,068, P(λ2) 0,178, P( λ12 ) 0,5,

таким образом все три гипотезы аппроксимирующих функций можно признать совместимыми с экспериментальными данными по критерию согласия А.Н. Колмогорова.

В данном примере наглядно подтверждается тезис о том, что критерий А.Н. Колмогорова дает завышенные результаты. Но и из полученных данных можно сделать вывод о том, что наиболее совместимым с экспериментальными данными является третья

аппроксимирующая функция распределения вероятности F21 (x) .

2.6.4. Критерий согласия К. Пирсона (критерий χ2)

Критерий согласия К. Пирсона (хи – квадрат) основан на выборе определенной меры расхождения между теоретическим и экспериментальным распределением значений [1].

Допустим,что вся область изменения величины разбита на l интервалов или групп (1, 2,…i……l), которые оформлены в виде ряда. При этом считаем, что pi есть вероятность того, что величина принимает значение, принадлежащее i-му множеству i (теоретическая вероятность), а

mi – число значений величины i из общего числа n , попавших в i (получено в результате эксперимента). Тогда должно выполняться условие

p1 + p2 +………..+ pi + ………..+ pl = 1 m1 + m2 + ………+ mi + ……….+ml = n.

Если проверяемая гипотеза верна, то mi представляет частоту появления события, имеющего в каждом из n произведенных испытаний вероятность Рi. Следовательно, можно рассматривать mi как случайную величину, подчиняющуюся биномиальному закону распределения с центром в точке

npi и средним квадратическим отклонением σi = npi (1 pi ) . Когда n

велико, можно считать, что частота распределена асимптотически нормально с теми же параметрами. При правильности выбранной гипотезы можно ожидать, что будут асимптотически нормально распределены также величины

ξi

= mi npi

i =1,2,.......l ,

 

npi

 

а в качестве меры расхождения данных выборки m1,m2, … mi …ml с теоретическими данными np1,np2,…..,npi,…..,npl рассматривается величина

 

l

l

npi )

2

 

 

 

χ2 = ξi2 = (mi

.

 

(35)

 

i=1

i=1

npi

 

 

 

Если проверяемая простая гипотеза верна,

то критерийχ2 имеет

распределение,

стремящееся

при

n

к распределениюχ2 .

Распределение

χ2 зависит от числа степеней свободы, которое в данном

случае определяется как разность

между

количеством интервалов l и

числом независимых условий r (наложенных связей).

При проверке гипотезы о законе распределения величины выбирается в уровень значимости q % (обычно от 5 до 10). Пусть χq2 обозначает q% предел для закона χ2 с (l - r) степенями свободы, определяемый по таблицам (см. приложение Б). Если гипотеза верна, то при достаточно большом n приближенно будем иметь

P ( χ2 > χq2 ) =

 

q

.

(36)

100

 

 

 

Определив значение χ2 по данным выборки, получают одно из двух: илиχ2 >χq2 , т.е. критерий попадает в критическую область и тогда

расхождение экспериментальных данных с теоретическим законом распределения существенно, или имеет место неравенство χ2 χq2 , т.е.

расхождение несущественно, а поэтому гипотеза о теоретическом законе распределения вероятности может быть принята. Это правило указывает

на то, что только в q% всех случаев проверки отбрасывается верная гипотеза о теоретическом законе распределения.

Для обоснованного применения критерия согласия χ 2 необходимо

иметь в виду, что при выводе формулы (35) предполагается, что биномиальное распределение частостей в каждом интервале или группе может быть сведено к нормальному. Но соответствующий предельный переход осуществляется достаточно быстро, только если ни одна из вероятностей pi и q не будут малыми. Отсюда следует, что применение критерия согласия будет обоснованным, если ни одна из частостей в любом интервале не будет мала. Поэтому рекомендуется при применении

критерия согласия χ 2 частости крайних интервалов, которые обычно представляют малые значения, объединять между собой, чтобы, как условились, частость объединенного интервала была не меньше 5.

Таблица значений χ 2 , соответствующих определенным вероятностям P(χ2 ) и различным числам степеней свободы (l - r) для критерия К. Пирсона, дана в приложении Б.

ПРИМЕР. Применим критерий К. Пирсона для проверки гипотез о законах распределения в нашем примере для всех трех аппроксимирующих функций. Результаты расчетов будут представлены в виде таблиц. Необходимо учесть, что при применении критерия согласия К. Пирсона под теоретической вероятностью pi понимается вероятность попадания отсчета в заданный интервал, рассчитанная с помощью аппроксимирующей функции. Т.е. при строгом подходе необходимо интегрировать аппроксимирующую функцию плотности распределения вероятности в каждом интервале, на которые разделен весь массив при построении гистограммы:

Qпр

Qлев

Qпр

Р(QлевQ Qпр ) = P(Q)dQ

P(Q)dQ =

P(Q)dQ

−∞

−∞

 

Qлев

где Qлев и Qпр – соответственно левая и правая границы интервала. К этому следует добавить, если аппроксимирующая функция плотности распределения вероятности имеет точку (несколько точек), в которой производной не существует, то необходимо учитывать особый характер этой точки (этих точек) и расчеты вероятности попадания в данный интервал целесообразно проводить в несколько этапов: рассчитывать вероятности попадания отсчетов в подынтервалы до особой точки и после нее. Сумма вероятностей в подынтервалах будет равна вероятности попадания отсчетов в интервал с особой точкой.

Прежде чем переходить к расчетам, определим число степеней свободы. В гистограмме 1 число интервалов 5, а связей, накладывающих ограничения, две (средние значения полигона распределения и аппроксимирующей функции должны быть равны; суммарная вероятность должна быть равна единице); в гистограмме 3 количество интервалов 15 и накладывалось три ограничения (суммарная вероятность равна единице; средние значения полигона распределения и аппроксимирующей функции должны быть равны; экстремальные значения полигона распределения и аппроксимирующей функции должны быть при одинаковых значениях отсчетов). Таким образом, в первом случае число степеней свободы должно быть r = 3, а во втором - r = 12.

1. Распределение, аппроксимирующая функция которого описывается трапецеидальным законом

Если учесть, что аппроксимирующая функция пересекает ось абсцисс при Qн 2,3757 и Qк 6,02435 (что определяется довольно просто), то теоретическую вероятность попадания в каждый из пяти интервалов рассчитываем по формулам

2,9625

 

3,375

 

3,7875

 

 

4,6125

 

 

P1 =

(aQ b)dQ ;

P2 = (aQ b)dQ +

cdQ ;

P3

= cdQ ;

2,3757

 

2,9625

 

3,375

 

 

3,7875

 

 

 

 

5,025

5,4375

 

6,02435

 

 

 

 

 

 

 

 

P4 = cdQ + (aQ +b)dQ ; P5 =

(aQ +b)dQ

 

 

 

 

4,6125

5,025

 

5,4375

 

 

 

 

 

Результаты вычислений сведены в табл. 16.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 16

 

 

 

 

 

Значения

 

Теорети-

Кол-во

 

 

 

 

 

 

 

 

 

границ

 

ческая

отсчетов

 

 

 

 

(mi npi )

2

 

 

 

интервалов

 

в интер-

 

 

 

 

 

 

 

п/п

 

 

 

 

вероят-

вале

 

 

npi

 

 

np

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Qлев

Qпр

 

ность

mi

 

 

 

 

 

i

 

 

 

 

 

 

pi

 

 

 

 

 

 

 

 

 

1

 

2

3

 

4

5

 

 

6

 

7

 

 

 

1

 

-

2,9625

 

0,062368

14

 

 

14,96832

0,062639

 

2

 

2,9625

3,7875

 

0,267827

78

 

 

64,2785

2,929112

 

3

 

3,7875

4,6125

 

0,29865

53

 

 

71,676

4,866245

 

4

 

4,6125

5,4375

 

0,267833

84

 

 

64,2785

6,049822

 

5

 

5,4375

 

0,062376

11

 

 

14,96832

1,052957

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ 2 = 14,96077 , число степеней свободы 5 – 2 = 3.

 

 

Из таблицы для распределения χ2 (приложение Б)

находим,

что для

уровня значимости q = 5% при числе степеней свободы 3

χq2= 7,8,

χ 2 q2,

т.е. гипотеза о законе распределения вероятности не подтверждается по критерию согласия Пирсона.

2. Распределение, состоящее из суммы двух квадратичных экспонент Здесь расчет вероятностей попадания отсчетов в интервал производится по разности функций распределения вероятности, которые определяются аналогично расчетам, приведенным в разделе 2.5.1

(применение критерия согласия Мозеса):

Qiпп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р2i = (А1еα1 (QQ1 )2 + А2 еα2 (QQ2 )2 )dQ =

Qiлле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

2

 

 

 

t2iпп

 

 

t2

π

 

 

1

1iпп

 

 

t1

 

1

 

0

 

 

2

 

 

 

0

 

 

 

 

 

 

 

 

 

= A1 α1

 

(

2π

 

e

 

2 dt1 +

2π

 

e

 

2 dt2 )-

- A1 α1

 

(

t

0

e

 

t2

21π

t

0

e

 

t2

21π

 

2 dt1 +

 

 

2 dt2 ),

π

 

 

1iлле

 

 

1

 

 

 

 

2iлле

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где t1i= 2α1 (Q 3,492)

,

t2i=

 

 

2α2 (Q 4,908)

, при этом интеграл

вероятности определяется в соответствии с рекомендациями, перечисленными в п. 2.5.1. В соответствии с этими рекомендациями (количество отсчетов в интервале должно быть не менее пяти) число интервалов уменьшено до тринадцати за счет объединения двух первых и двух последних интервалов (в первом интервале было два отсчета, а в последнем – один). Соответственно уменьшилось до 10 и число степеней свободы. Результаты расчетов приведены в табл. 17.

Таблица 17

 

Значения

Теорети

Кол-во

 

 

 

 

 

 

границ

-

отсчет

 

 

(m np)2

интервалов

ческая

ов

 

 

 

 

в интер-

npi

 

i

i

п/п

Qлев

Qпр

вероят-

 

 

np

 

 

ность

вале

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

pi

mi

 

 

 

 

 

1

2

3

4

5

6

 

 

7

 

1

-

2,902

0,0125

14

3

40,33333

 

2

2,902

3,138

0,0475

11

11,4

0,014035

 

3

3,138

3,374

0,11225

23

26,94

0,576229

 

4

3,374

3,61

0,155505

36

37,32

0,046772

 

5

3,61

3,846

0,112345

17

26,96

3,681271

 

6

3,846

4,082

0,04915

16

11,8

1,498272

 

Окончание табл. 17

1

2

3

4

5

6

7

7

4,082

4,318

0,0215

11

5,16

6,609612

8

4,318

4,554

0,04915

10

11,8

0,27345

9

4,554

4,79

0,112345

17

26,96

3,681271

10

4,79

5,026

0,155505

39

37,32

0,075517

11

5,026

5,262

0,11225

18

26,94

2,966726

12

5,262

5,498

0,0475

17

11,4

2,750877

13

5,498

+

0,0125

11

3

21,33333

Суммируя последнюю графу табл. 17,

получаем значение

χ 2 =

83,8407, Из таблицы для распределения

χ2 (приложение Б) находим, что

для уровня значимости q = 5% при числе степеней свободы 10 (13-3) χq2 = 18,3, χ 2 > χq2, т.е. гипотеза о законе распределения вероятности не подтверждается по критерию согласия Пирсона.

3. Распределение, состоящее из суммы двух экспонент Расчет вероятностей попадания отсчетов в интервал производится

по разности функций распределения вероятности, которые определяются аналогично расчетам, приведенным в разделе 2.5.1 ( применение критерия согласия Мозеса):

хпр

P21i = (А11еα11 хх1 + А21еα12 хх2 )dx

xлев

Вдиапазоне от - до Q =3,492 значение Р21i определяется по формуле

 

 

 

A1

 

e

α1

(Q Q)

+

 

 

A1

e

α1

(Q Q)

 

 

Qпр

 

 

 

 

 

 

 

Р21i =

 

 

 

1

 

1

 

1

 

 

 

2

 

2

2

 

 

 

,

α

1

 

 

α

1

 

 

 

1

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

Qлев

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в диапазоне от Q =3,492 до Q = 4,908 - по формуле

 

 

 

1

 

 

 

A1

 

α1

(QQ )

 

 

 

A1

 

α1 (Q Q )

 

Qпр

 

 

 

 

 

 

 

 

 

Р2i

=

 

 

1

e

 

1

1

+

 

 

 

2

 

e

2

2

 

,

α

1

 

 

α

1

 

 

 

 

1

 

 

 

 

 

 

 

2

 

 

 

 

 

Qлев

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в диапазоне от х = 4,908 до +- по формуле

 

 

1

 

 

 

1

 

 

Qпр

 

 

 

 

 

 

Р21i =

A1

eα11

(QQ1 ) +

A2

eα12 (QQ2 )

 

.

1

1

 

α

1

 

 

α

2

 

 

Qлев

 

 

 

 

 

 

 

В расчетах учитываем, что при Q1 = 3,492 и Q2 = 4,908 интеграл меняет знак на противоположный, поэтому интегрирование в интервалах, в которые попадают эти значения, целесообразно осуществлять в три этапа:

а) определяется вероятность попадания отсчета в подынтервал от

Qлев доQ1 = 3,492 (или Q2 = 4,908 ),

б) определяется вероятность попадания отсчета в подынтервал от

Q1 = 3,492 до Qпр, (или от Q2 = 4,908 до хпр),

в) определяется вероятность попадания отсчета в интервал, как

сумма вероятностей попадания отсчета в подынтервалы.

 

 

Результаты расчетов приведены в табл. 18.

Таблица

18

 

 

 

 

 

 

 

 

 

 

Значения

Теорети

Кол-во

 

 

 

 

 

 

границ

-

отсчет

 

 

(mi npi )2

 

интервалов

ческая

ов

 

 

 

п/п

 

 

вероят-

в интер-

npi

 

 

 

 

 

npi

 

 

 

Qлев

Qпр

ность

вале

 

 

 

 

 

 

 

 

pi

mi

 

 

 

 

 

1

2

3

4

5

6

 

7

 

 

1

-

2,902

0,053578

14

12,86

 

0,101295

 

 

2

2,902

3,138

0,04656

11

11,174

 

0,002718

 

 

3

3,138

3,374

0,087019

23

20,885

 

0,214255

 

 

4

3,374

3,61

0,137988

36

33,12

 

0,250946

 

 

5

3,61

3,846

0,091993

17

22,08

 

1,168058

 

 

6

3,846

4,082

0,058516

16

14,044

 

0,272506

 

 

7

4,082

4,318

0,048681

11

11,68

 

0,039978

 

 

8

4,318

4,554

0,058516

10

14,044

 

1,164344

 

 

9

4,554

4,79

0,091993

17

22,08

 

1,168058

 

 

10

4,79

5,026

0,137988

39

33,12

 

1,045003

 

 

11

5,026

5,262

0,087019

18

20,885

 

0,398441

 

 

12

5,262

5,498

0,04656

17

11,174

 

3,037237

 

 

13

5,498

+

0,053579

11

12,86

 

0,268721

 

Суммируя последнюю графу табл.

18, получаем значение χ2

=

9,13156.

Из таблицы для распределения

χ 2 (приложение Б) находим, что для

уровня значимости q = 5% при числе степеней свободы 10,

χq2

= 18,3,

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]