Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Курсовик «методы Обработки Экспериментальных Данных» По Математической Статистике (Джваршейшвили И. А

.).pdf
Скачиваний:
19
Добавлен:
07.10.2014
Размер:
229.72 Кб
Скачать

5. Построение гипотезы о распределении с помощью критерия согласия Пирсона.

Применим критерий Пирсона к сгруппированным данным. Запишем в таблице 4 интервальные распределения, пригодные для

непосредственного применения критерия Пирсона: Таблица 4

zi1 ;

- ;9,4

9,4;9,6

9,6;9,8

9,8;10

10;10,2

10,2;10,

10,4;10,

10,6;10,

10,8;11

11;+

 

 

 

 

 

4

6

8

 

 

i

5

6

8

13

17

18

15

11

8

9

5.2.Вычисление теоретических частот.

Здесь принята гипотеза о нормальном распределении случайной величины. В этом случае теоретические вероятности вычисляются по формуле

pi=Ф0 zix Ф0 zi1x , S S

где:

x

- выборочная средняя;

 

 

 

 

 

 

S – исправленная выборочная дисперсия;

 

 

1

0

Ф0

x =

 

ez 2/2 dz - функция Лапласа.

 

 

 

 

 

2

x

Процедура отыскания теоретических вероятностей и частот показана в расчетной таблице 5.

Таблица 5

n=110 λ=0,26 x0=10,27

концы

ui1=

ui=

 

 

 

Pi =

 

i =

проме-

 

 

 

 

zi1x0 ;

zi x0 ;

eui1

eui

 

 

жутков

e

ui1

e

ui

 

 

при x0 zi1

при x0 zi

 

 

 

 

n Pi

zi 1

zi

 

 

 

 

 

 

 

 

 

 

 

-

9,4

0,00

1,4

1,0000

0,2470

 

0,7530

 

82,84

9,4

9,6

1,40

1,44

0,2470

0,2368

 

0,0102

 

1,12

9,6

9,8

1,44

1,48

0,2368

0,2271

 

0,0097

 

1,07

 

 

 

 

 

 

 

 

 

 

9,8

10

1,48

1,52

0,2271

0,2177

 

0,0093

 

1,03

10

10,2

1,52

1,57

0,2177

0,2088

 

0,0090

 

0,98

 

 

 

 

 

 

 

 

 

 

10,2

10,4

1,57

1,61

0,2088

0,2002

 

0,0086

 

0,94

 

 

 

 

 

 

 

 

 

 

10,4

10,6

1,61

1,65

0,2002

0,1919

 

0,0082

 

0,91

10,6

10,8

1,65

1,69

0,1919

0,1840

 

0,0079

 

0,87

 

 

 

 

 

 

 

 

 

 

10,8

11

1,69

1,73

0,1840

0,1765

 

0,0076

 

0,83

11

+

1,73

+

0,1765

0,0000

 

0,1765

 

19,41

:

1,0000

110

 

 

Значение функции

Ф0

x при различны x находятся по таблицамБ

имеющимся практически в любом руководстве по теории вероятностей; при

этом следует учесть, что

Ф0 x =−Ф0 x и при

x 4 можно принять

Ф0

x 0,5 .

 

 

 

 

 

 

 

 

 

В качестве функции Лапласа берется интеграл

 

 

 

 

 

1

 

x

 

 

 

 

 

Ф x =

 

−∞ez2 /2 dz

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

и приводятся таблицы его значений. Формула для подсчета Pi остается

верной, если в ней Ф0 заменить на Ф.

 

 

5.3.

Статистика

x2 и вычисление её значения по опытным

 

данным.

 

 

 

 

 

 

 

Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая величина, характеризующая степень расхождения теоретического (предполагаемого) и статического распределений.

В критерии Пирсона в качестве такой меры расхождения используется величина:

X2=i'i 2

i ' i

называемая статистикой «хи-квадрат» или статистикой Пирсона.

Вычислим значение x2 для нашего варианта; это значение, найденое по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать

через x2набл

Таблица 6

i

i

'

'

i

2

/ '

 

 

i

i

 

i

1

5

82,840

73,14

 

 

 

 

 

 

2

6

1,120

21,26

 

 

 

 

 

 

3

8

1,070

44,88

 

4

13

1,030

139,11

 

 

 

 

 

 

5

17

0,980

261,88

 

6

18

0,940

309,62

 

 

 

 

 

 

7

15

0,910

218,16

 

8

11

0,870

117,95

 

 

 

 

 

 

9

8

0,830

61,94

 

10

9

19,410

5,58

 

 

 

 

 

 

 

 

:

110

110

1247,95

 

X2набл=1247,95

5.4.Распределение статистики x2

Начнем мы с несколько отвлеченного определения. Говорят, что случайная величина имеет x2 -распределение с r степенями свободы (r=1; 2; 3; …) , если ее плотность имеет вид

k r x ={0cr xr/21 ex /2

приприxx0,0,} ;

где cr - некоторая положительная постоянная ( cr определяется из

равенства −∞kr x dx=1 . Случайная величина, имеющая распределение

x2 с r степенями свободы, будет обозначаться через x2r .

Для дальнейшего изложения важно лишь отметить, что, во-первых, распределение x2 определяется одним параметром — числом r степеней свободы и, во-вторых, существуют таблицы, позволяющие приближенно найти вероятность попадания значений случайной величины x2r в любой промежуток.

Ранее отмечалось , что статистика

Вернемся теперь к статистике x2=i 2i / 2i . Отметим, что она

i

является случайной величиной, поскольку зависит от результатов наблюдений

и, следовательно, в резличных сериях опытов принимает различные, заранее не известные значения. Понятно, кроме того, что закон распределения

статистики x2 зависит: 1) от действительного (но неизвестного нам)) значения распределения случайной величины, измерения которой осуществляется (им определяется эмпирические частоты 1 ); 2) от количества произведенных наблюдений и от способа разбиения числовой оси

на промежутки от теоретического закона распределения изучаемой случайной величины.

Если выдвинутая гипотеза верна, то, очевидно, закон распределения

измеряемой случайной величины, от числа n и от выбора промежутков разбиения. Но на самом деле, в этом случае справедливо куда более сильное утверждение. А именно, при достаточно больших n закон распределения

статики x2 практически не зависит ни от закона распределения изучаемой случайной величины и ни от количества n произведенных опытов. Эта теорема объясняет, почему статистика Пирсона обозначается через x2 .

Если в качестве предпологаемого выбрано одно из трех основных непрерывных распределений (нормальное, показательное или равномерное), то r=l-3, где l — количества промежутков, на которые разбита числовая ось. В общем случае

r =lN пар1,

где N пар - количество параметров предполагаемого распределения, которые заменены вычисленными по опытным данным оценками.

5.5. Правило проверки гипотезы о законе распределения случайной величины.

x2=i2i / 2i принимает i

только неотрицательные значения, причем в нуль она обращается в одном-

единственном случае — присовпадении всех соответствующих эмпирических и

теоретических частот (то есть при i = 'i для каждого i).

Если выдвинутая гипотеза о законе распределения изучаемой случайной величины соответствует действительности, то эмпирические и теоретические частоты должны быть примерно одинаковы, а значит, значения статистически

z2 будут группироваться около нуля. Если же выдвинутая гипотеза ложна,

то эмпирические и соответствующие теоретические частоты будут существенно разниться, что приведет к достаточно большим отклонениям от

нуля значений x2 .

Поэтому хотелось бы найти тот рубеж — называемый критическим

значением (или критической точкой) и обозначаемый через

x2крит , который

разбил бы всю область возможных значений статистики x2

на два не

пересекающихся подмножества (рис.4): область принятия гипотезы,

характеризующуюся неравенством x2 x2

крит , и критическую область ,

определяемую неравенством x2 x2

крит.

рис. 4

 

рис. 5

 

 

 

 

 

 

Как же найти критическое значение x2крит

?

 

 

 

 

Если выдвинутая гипотеза о законе распределения изучаемой случайной

величины верна, то вероятность попадания значений статистики

x2

в

критическую область должна быть мала, так что событие (

x2x2

крит

)

должнобыть практически неосуществимым в единичном испытании. Эта

вероятность, обозначим ее через α:

 

 

 

 

 

 

=P x2x2крит

,

 

 

 

 

называется уровнем значимости.

x2

 

 

 

 

 

Чтобы определить критическое значение

крит , поступим следующим

образом. Зададим какое-либо малое значение уровня значимости α и найдем

x2

крит как корень уравнения

 

 

 

 

 

 

P x2x =

 

 

x2 близко при

с неизвестной x. Поскольку распределение статистически

n к x2 -распределению с r степенями свободы, то

 

 

 

 

P x2x =P x2r x ,

 

 

 

и приближенное значение x2крит можно найти из уравнения

P x2r x = kr t dt= .

x

Геометрические соображения показывают, что последнее уравнение

имеет единственное решение: его корень — это такое число x>0, при котором площадь под графиком функций k r t (плотности x2 -распределения) над

участком (x; + ) равна α (рис. 5). На практике решение последнего уравнения находят с помощью специальных таблиц. Эти таблицы позволяют по двум входным параметрам — уровню значимости α и числу степеней свободы r

определить критическое значение x2крит .

Подводя итоги, сформулируем правило проверки гипотезы о законе распределения случайной величины с помощью x2 -критерия Пирсона:

1.Проводят n независимых наблюдений случайной величины;

2.Разбивают всю числовую ось на несколько промежутков

 

−∞ ; z1 , [ z1

; z2 ) , [ z2

; z3 ) , ... , [ zl1 ; ) ;

 

так, чтобы количество результатов измерения в каждом из них оказалось

3.

не менее пяти.

 

 

 

Выдвигают гипотезу о законе распределения изучаемой случайной

 

величины и находят параметры этого закона;

4.

С помощью предполагаемого (теоретического) распределения находят

 

теоретические вероятности

Pi и теоретические частоты 'i=npi

 

попадания значений случайной величины в i-й промежуток;

5.

По эмпирическим и теоретическим частотам вычисляют значение

6.

статистики x2 , обозначаемое через

x2набл .

Определяют число r степеней свободы.

7.

Используя заданное значение уровня значимости α и найденное число

8.

степеней свободы r, по таблице находят критическое значение x2крит .

Формулируют вывод, опираясь на основной принцип проверки

 

статистических гипотез:

 

 

 

- если наблюдаемое значение критерия принадлежит критической

 

области, то есть если

x2набл x2крит

, то гипотезу отвергают как плохо

 

согласующуюся с результатами эксперимента;

 

- если наблюдаемое значение критерия принадлежит области принятия

 

гипотезы, то есть x2

набл x2крит , то гипотезу принимают как не

 

противоречащую результатам эксперимента.

5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в примерах.

Правило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины для нашего варианта реализовано в таблице 7

Таблица 7

Название величины

Обозначение и числовое значение

 

величины

Уровень значимости (задан в условии)

α=0,05

 

 

Количество промежутков разбиения

l=10

 

 

Число степеней свободы

r=7 r=l-3

 

 

Критическое значение (находится по

xкрит2 =14,07

таблице)

 

Наблюдаемое значение критерия

xнабл2 =1247,95

Гипотеза НЕ ПРИНИМАЕТСЯ т.к. x2набл x2крит .

ЗАМЕЧАНИЯ: 1) Заданное значение уровня значимости α=0,05 означает,

что

P x2 x2крит ≈ =0,05

то есть вероятность события { x2x2крит } очень мала, однако это событие,

обладая нулевой вероятностью, все же может осуществиться, и тогда будет отвержена правильная гипотеза. Отвержение гипотезы когда она верна

называется ошибкой первого рода. Таким образом, уровень значимости α — это

вероятность ошибки первого рода. Отметим, что ошибкой второго рода называется принятие гипотезы в случае, когда она неверна.

2) Иногда вместо уровня значимости α задается надежность γ:

=P x2 x2крит

то есть - это вероятность попадания значений статистики x2 в области принятия гипотезы. Поскольку события

{ x2 x2крит } и

{ x2 x2крит }

противоположны, то

 

 

P x2 X 2

крит =1P x2 x2крит =1.