- •1. Обработка результатов измерений. Прямые многократные измерения
- •2. Проверка гипотезы о распределении размеров в выборке
- •3. Проверка гипотезы о равномерном распределении по критерию
- •4. Оценка результатов при малом числе измерений и неизвестном
- •5. Проверка гипотезы о независимости последовательности результатов измерений
- •6. Обработка результатов косвенных измерений
- •Приложение Статистические таблицы
2. Проверка гипотезы о распределении размеров в выборке
В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели (гипотезе) закона распределения используется критерий согласия. Известен целый ряд критериев согласия, предложенный разными авторами.
Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределения, совпадение с которым определяется. Использование критерия Пирсона возможно при большом числе измерений и заключается в вычислении величины (хи-квадрат):
, (8)
где и – экспериментальные и теоретические значения частот в -м интервале рассеяния.
Вероятность попадания непрерывной случайной величины в интервал вычисляется в общем виде из соотношения
,
Где – функция распределения вероятностей или интегральная функция распределения.
При случайная величина имеет распределение Пирсона с числом степеней свободы , где – число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения , так как закон однозначно характеризуется указанием двух его параметров математического ожидания и СКО.
Таким образом, вычисленную для данной выборки величину сравнивают с критической точкой, взятой из таблиц теоретического распределения , по заданному уровню значимости а и числу степеней свободы . Если , отклонения теоретического и эмпирического закона распределения считается незначительным, т.е. проверяемая статистическая гипотеза верна. В противном случае гипотеза отвергается.
Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем:
определяют оценки среднего арифметического значения и СКО по формулам (4) и (5);
группируют результаты многократных наблюдений по интервалам (разрядам) длиной , число которых определяют так же, как и при построении гистограммы;
для каждого разряда разбиения определяют его центр и подсчитывают число наблюдений , попавших в каждый из интервалов, теоретически соответствующее выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов переходят к нормированным серединам
. (9)
Затем для каждого значения с помощью аналитической модели находят значение функции плотности вероятностей . Например, для нормального закона
,
или по таблицам дифференциальной функции нормального распределения (табл. П1 приложения).
По найденному значению определяют ту часть имеющихся наблюдений, которая теоретически должна быть в каждом из интервалов:
, (11)
где – общее число наблюдений.
Если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединяют с соседним интервалом. После этого определяют число степеней свободы , где – общее число интервалов, – число укрупненных интервалов.
По формуле (8) определяют показатель разности частот ;
Выбирают уровень значимости критерия . Он должен быть небольшим, чтобы была мала вероятность совершить ошибку первого рода. По уровню значимости и числу степеней свободы по табл. П2 приложения находят границу критической области такую, что . Вероятность того, что полученное значение перевешивает , равна а и мала. Поэтому, если оказывается, что , то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же то гипотеза принимается.
Чем меньше , тем большее значение . тем легче выполняется условие и проверяемая гипотеза принимается. Но при этом увеличивается вероятность ошибки второго рода. В связи с этим нецелесообразно принимать .
Иногда вместо проверки с односторонней критической областью принимают проверки с двусторонними критическими областями. При этом оценивают вероятность . Уровень значимости критерия делится на две части . Как правило, принимают ; и . Гипотеза о совпадении распределений принимается, если
Пример 2. По данным примера 1 проверить гипотезу о законе распределения случайной величины , используя критерий , на уровне значимости , результаты измерений которой представлены выборкой объемом ; ; ; .
Решение. По виду гистограммы (рис. 1) выдвигаем гипотезу о нормальном распределении. Для вычислений целесообразно все данные свести в табл. 4.
Пояснения к табл. 4:
При вычислении аргумента дифференциальной функции нормированного распределения использованы данные предыдущих расчетов (пример 1). Значения функции находятся по табл. П. 1 приложения и заносятся в колонку 6 (табл. 4).
В колонке 7 вычисляется плотность вероятности физической величины в единицах этой величины.
При вычислении критерия частоты меньше 5 эмпирического и теоретического распределений суммируются с соседними интервалами (колонки 3 и 8).
Для нахождения граничных значений критерия определяем число степеней свободы:
где – число разрядов, – число связей, накладываемое законом распределения, – число укрепленных интервалов.
При и уровне значимости по табл. П. 2 приложения находим граничные значения критерия :
; .
Так как и , то гипотеза о нормальном распределении принимается.
Таблица 4
Номер разряда
|
Середина разряда |
Частота |
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
1,09 |
4 |
-0,23 |
-2,11 |
0,0431 |
0,3954 |
3,16 |
|
2 |
1,17 |
12 |
-0,15 |
-1,38 |
0,1539 |
1,4120 |
11,30 |
0,164 |
3 |
1,25 |
20 |
-0,07 |
-0,64 |
0,3251 |
2,9826 |
23,96 |
0,624 |
4 |
1,33 |
36 |
0,01 |
0,09 |
0,3973 |
3,6450 |
29,16 |
1,604 |
5 |
1,41 |
16 |
0,09 |
0,82 |
0,2850 |
2,6147 |
20,92 |
1,087 |
6 |
1,49 |
8 |
0,17 |
1,56 |
1,0844 |
1,0844 |
8,68 |
0,046 |
7 |
1,56 |
4 |
0,24 |
2,20 |
0,3255 |
0,3257 |
2,60 |
|
|
- |
100 |
- |
- |
- |
- |
- |
3,525 |