Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1rabinovich_s_g_pogreshnosti_izmereniy

.pdf
Скачиваний:
72
Добавлен:
10.04.2019
Размер:
8.72 Mб
Скачать

где tq q-процентная точка распределения Стьюдента; значение tq находят в табл. П-7 по числу степеней свободы k = п—1 и уровню значимости q = 1− α .

Приведенные выше методы позволяют проверить допустимость гипотезы о нормальном распределении наблюдений и, следовательно, о допустимости применения распределений Стьюдента. Уровень значимости q, принимаемый для построения доверительного интервала, следовало бы согласовывать с уровнем значимости, принятым при проверке нормальности распределения, но эта задача не имеет пока что определенного решения.

Доверительная вероятность не должна быть слишком низкой. В

измерительной технике постепенно все чаще доверительную вероятность принимают равной 0,95 или 0,99 и лишь иногда 0,90. Эти цифры соответствуют соображениям, изложенным в § 1-6.

На практике доверительные интервалы строят на основе распределения Стьюдента, часто без проверки допустимости этого. То, что при этом, как правило, не возникает недоразумений, косвенно подтверждает высказанное выше мнение, что реальные распределения это усеченные распределения, более «узкие», чем нормальные.

Если измерение выполняется изученным методом и известно среднее квадратическое отклонение наблюдений для этого метода σ , то доверительный интервал для А строят по нормальному распределению:

ì

 

 

σ ü

= α

 

Pí

x - A

£ zα

 

 

 

ý

(3-25)

 

 

 

 

 

î

2

 

n þ

 

 

где α выбранная доверительная вероятность, п число выполненных

наблюдений, zα квантиль нормированного распределения

Лапласа,

2

которую находят по табл. П-2 для вероятности, равной α2 .

Иногда строят доверительные интервалы для среднего квадратического отклонения. Для этого используют распределение χ 2 , приведенное в табл. П-3.

 

 

 

 

 

 

 

 

n 1

~

 

 

 

n 1

~

 

Доверительный интервал с границами

 

 

 

 

 

σ

и

 

 

 

 

 

σ для вероятности

 

χH

 

 

 

 

χB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ì

 

 

~

 

 

 

~ü

 

 

 

 

 

 

 

 

n -1

 

 

n -1

 

 

 

 

 

 

 

Pí

 

 

 

σ < σ <

 

 

 

 

 

σ ý

= α

 

 

(3-26)

 

 

 

 

 

χB

 

 

 

î

 

χH

 

 

þ

 

 

 

 

 

 

находят следующим

образом. В

табл. П-3

 

даны вероятности

P{χ2 > χq2}. Значение χB2

находят из таблицы для ρB =

1

,

 

 

1−α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

а χH2 для ρH =

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

5

 

 

 

 

 

 

Например, получено

σ = 1,2 ×10

,

n =10 . Примем

α = 0,90. Тогда

 

 

 

 

ρB

=

1+ 0,9

= 0,95, ρH

=

10,9

= 0,05 . Число степеней

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

свободы k = 10-1=9. По

табл. П-3 находим

χB2 = 3,25 и χH2 = 16,92 .

Доверительный интервал будет

 

 

 

 

 

 

 

 

é

 

 

 

 

 

 

 

 

 

 

ù

10 -1

 

×1,2

× 205;

10 -1

×1,2 × 205

ê

 

 

 

 

 

 

ú

 

 

 

 

 

 

16,92

 

3,325

 

ë

 

 

 

 

 

 

 

û ,

т. е. [0,88 ×105 ;2,0 ×1,05 ].

Доверительная вероятность в этом случае может быть принята меньшей, чем при построении доверительного интервала для истинного значения измеряемой величины. Часто можно считать достаточным α = 0,70 .

3-8. Толерантные интервалы

Толерантным интервалом называется интервал, который с заданной вероятностью α содержит не менее чем заданную часть р0 всей совокупности случайной величины (генеральной совокупности). Таким образом, толерантный интервал интервал для случайной величины, и этим он в принципе отличается от доверительного интервала, который строится, чтобы накрыть неслучайную величину.

Границы толерантного интервала

l1 = x - Kσ~ и l2 = x + Kσ~ ,

где x и σ~ вычисляются по формулам (3-11) и (3-18) на основе имеющейся группы данных.

Толерантный множитель вычисляется по формуле

æ

 

zα

 

 

5zα2 +10

ö

ç

 

 

 

 

 

 

÷

+

 

 

+

 

K = zç1

 

2n

12n

÷

è

 

 

 

 

ø ,

где zи zα определяются по уравнениям [49]:

 

1

 

 

z

 

 

 

 

òey 2 / 2dy = 2Ф(z) = ρ0

 

 

 

 

 

 

 

 

 

 

 

 

2π

,

 

 

 

 

z

 

 

 

 

 

 

 

 

1

 

 

òey 2 / 2dy = 0,5 - Ф(zα ) =1-α

 

 

 

 

 

 

 

 

 

 

 

2π z

 

 

 

 

 

 

 

 

α

 

 

 

Значения Ф(z) приведены в табл. П-2.

Для наиболее употребительных уровней α и ρ0 составлены таблицы

для определения толерантного множителя.

Если, например, измерена чувствительность группы тензорезисторов, то полученным данным можно найти интервал с границами l1,l2 , в

котором с заданной вероятностью α будет находиться чувствительность не менее части ρ0 всей партии (или всей совокупности) тензорезисторов данного типа.

Термин «толерантный интервал» часто интерпретируют как допусковый интервал, а «толерантные границы» — как границы поля допуска, допуск. Однако в такой трактовке этих терминов есть существенная неточность.

Допуск, или границы поля допуска, устанавливают, как правило, до изготовления изделия и так, что изделия, интересующий нас параметр которых выходит за пределы поля допуска, признаются негодными, бракуются. Иными словами, границы поля допуска жесткие границы, не связанные ни с какими вероятностными соотношениями.

Толерантный же интервал определяют на основе исследований уже изготовленных изделий и вычисляют его границы так, чтобы с заданной вероятностью в этот интервал попадали параметры заданной доли всего возможного числа изделий. Таким образом, границы толерантного интервала, так же как и границы доверительного интервала, — случайные величины, и этим они отличаются от допусковых границ, или допусков, которые являются неслучайными.

3-9. Проверка однородности наблюдений

Измерения с большими случайными погрешностями требуют настороженного внимания. Необходимо удостовериться в том, что получаемые результаты, статистически подконтрольны, устойчивы, т. е.

что результаты наблюдений группируются вокруг одного и того же центра и имеют одну и ту же дисперсию. Если метод измерения и объект исследования изучены мало, то наблюдения при таком измерении нужно повторять до тех пор, пока не появится уверенность в устойчивом характере этих результатов [64]. Тем самым определяются продолжительность исследования и необходимое число наблюдений.

Устойчивость измерений часто оценивается интуитивно на основе длительных наблюдений. Однако известны математические методы, полезные для решения рассматриваемой задачи, так называемые методы проверки однородности. Применительно к измерениям рассматривается однородность групп наблюдений. Необходимые признаки однородности групп наблюдений состоят в том, что оценки средних арифметических и дисперсий не должны иметь значимых смещений относительно друг друга.

Выполнение необходимых признаков однородности условие необходимое, но недостаточное для действительной однородности, так как группы наблюдений можно неправильно или неудачно выбрать.

На рис. 3-3 приведены результаты наблюдений некоторой величины, представленные в той последовательности, в какой они были получены. Если взять три группы наблюдений, выполненные за интервалы времени

t2 t1,t3 t2 ,t4 t3 , то они, по-видимому, будут однородными. Между тем

последующие наблюдения дали бы существенное отличие от первых, и в

целом полученные по первым группам наблюдений результаты дадут картину устойчивого, статистически подконтрольного измерения, чего нет на самом деле.

Выбор групп для контроля однородности остается задачей специалиста-экспериментатора, так же как и отграничение одной группы от другой. Обычно наблюдения, выполненные через

интервалы времени, большие, чем время для получения какой-то совокупности результатов наблюдений, относят к разным группам. Целесообразно иметь в группе порядка 10 наблюдений (от 5 до 10 наблюдений согласно работе [20, стр. 123] и лучше несколько таких групп, чем одну группу с большим числом наблюдений.

Приведем некоторые из числа наиболее часто применяемых методов проверки допустимости различия между оценками дисперсий и различия между средними арифметическими групп наблюдений. Предполагается, что распределения наблюдений предварительно проверены на нормальность.

Проверка допустимости различия между оценками дисперсий

выполняется с помощью критерия Р. Фишера в случае двух групп наблюдений и критерия М. Бартлетта, если групп больше. Приведем последовательно оба метода.

Пусть несмещенные оценки дисперсий этих групп S12 и S22 , причем

S12 > S22 . Число наблюдений в группах

n1 и n2 ,

так что степени свободы

равны соответственно k1 = n1 1 и k2 = n2 1. Составляем отношение

F =

S 2

 

1

 

(3-27)

S22

 

 

Затем из табл. П-8 и П-9, где приведены вероятности

P{F > Fq }= q

(3-28)

для различных степеней свободы k1 и k2 , выбираем значение Fq .

Гипотеза принимается, т. е. оценки дисперсий можно считать отвечающими одной и той же дисперсии, если выполняется неравенство

F < Fq . Уровень значимости при этом равен 2q. Теперь пусть у нас есть L

групп и для них найдены S12 ,..., S22 несмещенные оценки дисперсий групп наблюдений (L>2),

каждая из которых имеет ki = ni -1 степеней свободы, причем все ki > 3 .

Проверка гипотезы о равенстве дисперсий групп основана на статистике

æ 1

L

2

ö

L

2

 

M = N lnç

 

åkiSi

÷

- åki ln Si

(3-29)

 

è

N i=1

 

ø

i=1

 

 

N

где N = åki .

i=1

Если гипотеза о равенстве дисперсий верна, то отношение

χ2

=

 

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

æ

L

1

 

1

ö

(3-30)

 

1+

 

ç

å

-

÷

 

2(L -1)

ç

ki

 

÷

 

 

 

 

è i=1

 

N ø

 

распределено приближенно как χ2 с L 1 степенями свободы [6]. Задаваясь уровнем значимости q, из табл. П-3 находим χq2 такое, что

P{χ2 > χq2}= q . Если выполняется неравенство χ12 < χq2 , то различия между

оценками дисперсий допустимы.

Проверка допустимости различий между средними арифметическими выполняется тоже по-разному в случав двух групп наблюдений и если этих групп больше.

Рассмотрим сначала сравнение средних арифметических для двух групп наблюдений, когда наблюдений много, так что каждую из оценок дисперсий можно считать совпадающей со своей дисперсией.

Обозначим через x1 , σ12 , n1 данные, относящиеся к одной группе, а через x2 , σ22 , n2 ко второй. Составим разность x1 - x2 и оценим ее дисперсию:

 

2

(x1

σ 2

σ 2

σ

 

- x2 )= n1

+ n2 .

 

 

 

1

2

Затем, выбрав определенный уровень значимости q, находим α =1 q и

по табл. П-2аргумент zα 2

функции

Лапласа, соответствующий

вероятности α2.

Различие между средними арифметическими считается допустимым, если

x1 - x2

 

£ zα σ (x1 - x2 )

(3-31)

 

 

2

 

.Если дисперсии групп неизвестны, то задача решается лишь при условии, что обе группы имеют одинаковые дисперсии (оценки этой дисперсии

σ~12 и σ~22 могут, естественно, отличаться). В этом случае вычисляется

 

 

 

x1 - x2

 

 

 

 

 

 

 

t =

 

 

 

 

 

 

 

n n (n + n - 2)

 

 

 

 

 

 

1

2

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~2

+ (n

~2

 

 

 

 

 

n1 + n2

 

 

(n -1)σ

1

-1)σ

2

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

Затем, задаваясь уровнем значимости q, по табл. П-7 для распределения Стьюдента при числе степеней свободы k = n1 + n2 2 находим tq . Различие между средними арифметическими считается допустимым, если t < tq .

При большом числе групп допустимость различия между средними арифметическими проверяется с помощью критериев Р. Фишера и Э Аббе. Для применения каждого из них необходимо предварительно проверить, что все группы имеют одну и ту же дисперсию.

Метод Фишера состоит в сравнении оценок межгрупповой дисперсии

SL2 и средней дисперсии групп

 

 

2

[49]:

 

S

 

 

 

 

 

 

 

 

 

1

 

 

L

 

 

SL2 =

 

 

 

åni (xi x)2 ,

 

 

 

 

 

 

 

 

 

 

L 1 i=1

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

 

 

 

 

 

 

 

 

 

 

åni xi

L

 

x =

 

i=1

 

 

 

и N = åni

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

(оценка SL2 имеет k1 = L 1 степеней свободы);

 

 

2 =

 

 

 

 

1

 

ååL ni

(xij xi )2

S

 

 

 

 

 

N

 

 

 

 

 

 

 

L i=1 j=1

 

(число степеней свободы k2 = N L ).

Обе оценки дисперсий имеют χ2 -распределение с числом степеней свободы соответственно k1 и k2 . Их отношение имеет распределение Фишера с теми же степенями свободы.

Рассеивание средних арифметических считают допустимым, если F = SL2 S 2 при выбранной вероятности α лежит в пределах FH и FB :

P{FH F FB}= α .

Верхние пределы распределения Фишера FB приведены в табл. П-8 и П-9, нижние находят по соотношению FH =1FB .Если уровни значимости при нахождении FB и FH приняты одинаковыми: q1 = q2 = q , то общий уровень значимости критерия будет 2q:

α =12q .

Метод Аббе менее чувствителен к рассеиванию средних арифметических, чем метод Фишера, но зато позволяет выявлять монотонные смещения средних арифметических. Техника применения этого метода состоит в следующем.

Средние арифметические значения групп следует выписать в последовательности, соответствующей очередности их получения,

x1, x2 ,...,xL .

Затем находим две несмещенные оценки дисперсии группы средних арифметических: одну по обычной формуле (3-13)

 

 

 

1

 

L

 

 

S12 =

 

 

å(x1 x)2 ,

 

 

 

 

 

 

L 1 i=1

где

 

 

 

 

 

 

 

 

1

 

N

 

 

 

L

x =

åni xi

и Nåni ,

 

 

N i=1

 

 

 

i=1

вторую по формуле

 

 

 

 

 

 

 

 

 

 

 

 

1

 

L1

S22 =

 

 

 

ådi2 ,

 

2(L

 

 

 

 

 

1) i=1

где

 

 

 

 

 

 

 

d1 = x2 x1,...; di

= xi+1 xi ,...; dL1 = xL xL1 .

Отношение ν = S22 S12 должно

 

быть меньше νmin . Критические

значения νmin в зависимости от уровня значимости q и числа групп L

приведены в табл. П-10.

Методика проверки допустимости рассеивания средних арифметических групп при разных дисперсиях групп доже разработана (см., например, [55]), но более сложна.

Нужно заметить, что значимое различие между средними

арифметическими может служить как признаком наличия постоянной систематической погрешности в результатах наблюдений той или иной группы, так и признаком непостоянства интересующего нас параметра модели, поставленной в соответствии объекту исследования. Последнее означает, что постулат γ не выполняется и, следовательно, измерение с требуемой точностью осуществить нельзя.

3-10. Об обработке наблюдений, распределение

которых нельзя считать нормальным

Нормальное распределение служит весьма распространенной моделью рассеивания наблюдений. Однако иногда эта модель оказывается не соответствующей экспериментальным данным. Если удается найти другую модель, т. е. другую функцию распределения, то задачу оценивания параметров модели, и в том числе истинного значения измеряемой величины, можно решить на основе принципа максимума правдоподобия. В общем

случае

при известной функции распределения наилучшую оценку измеряемой величины дает формула Питмэна:

~

+∞uf (x - u)... f (x - u)du

ò

1

n

 

 

A = −∞+∞ .

ò f (x1 - u)... f (xn - u)du

−∞

Дисперсия оценки Питмэна не превышает дисперсию оценки, получаемой на основе принципа максимума правдоподобия.

Однако чаще всего, если распределение нельзя признать нормальным, то точно функцию распределения установить не удается. В этом случае, опираясь на симметричность распределения и используя сведения, приведенные в обзоре А. И Механникова*6, можно рекомендовать следующую схему решения задачи.

Из результатов наблюдений составляется вариационный ряд, т. е. ряд, в котором результаты наблюдений расположены в порядке возрастания:

x1 £ ... £ xi £ ... £ xn .

В качестве числовой характеристики типа распределения экспериментальных данных принимают значение κ , вычисляемое по формуле

n

å(xi - x)4

κ =

i=1

,

nS 4

 

где S2 выборочная дисперсия.

При κ ³ 4 в качестве оценки измеряемой величины целесообразно взять оценку медианы, составляемую по полученному вариационному ряду:

 

ì

1

æ

 

 

 

 

 

 

ö

 

ï

ç

x

 

+ x

 

 

÷

 

 

 

 

n

n

 

, если n четное,

~

ï

2

ç

 

 

 

+1

÷

 

 

 

 

 

A = í

è

 

 

2

 

2

 

ø

 

ï

 

 

 

 

 

 

 

 

 

если n нечетное.

 

ïxn+1 ,

 

 

 

 

î

 

 

2

 

 

 

 

 

 

 

Если 2.5 < κ < 4 , то за оценку измеряемой величины целесообразно принять среднее арифметическое результатов наблюдений.

6 Механнйков А. И, Методы оперативной обработки результатов наблюдений при помощи порядковых статистик. — Метрология, 1972, 4, с 47 — 58.

При распределениях, приближающихся к равномерному (1.8 ≤ κ ≤ 2.5),

наиболее целесообразной оценкой измеряемой величины надо считать полуразмах:

 

 

~

x

1

+ x

n

 

 

 

 

A =

 

 

.

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

Критические значения и выбраны несколько условно.

 

Точность

результата

можно

 

 

охарактеризовать

длиной

непараметрического доверительного интервала.

 

Если хк и xn-k+1

соответственно k-я и (п–k+1)-я порядковые статистики,

составленные по выборке, принадлежащей генеральной совокупности с непрерывным симметричным распределением, то интервал [xk , xnk +1] является

доверительным интервалом для центра распределения случайной величины, а

доверительная вероятность равна

P{xk < A < xnk +1

}=

 

1

nk

 

 

åCnl .

 

 

n

 

 

 

 

 

 

 

2 i=k

 

В частности, при

 

 

 

 

 

 

 

 

 

k = 2 P{x2 < A < xn1

}= 1 -

n -1

,

n 1

 

 

 

 

 

 

 

 

2

 

k = 3 P{x

3

< A < x

n2

}= 1 - n2 + n + 2 .

 

 

 

 

 

 

2n

 

Для k > 3 расчетные формулы существенно усложняются. Но для k=4 и 5 можно воспользоваться приближенными соотношениями, приведенными в упомянутой статье А. И. Механникова:

k = 4 P{x4 < A < xn3

}» 1-

0.17n3

 

 

,

2

n 1

 

 

 

k = 5 P{x5 < A < xn4 }» 1 - 0.037n4 . 2n1

Рассматривая обработку результатов наблюдений, распределение которых отличается от нормального, нужно заметить, что, поступаясь эффективностью, в

качестве оценки измеряемой величины практически всегда можно взять среднее арифметическое результатов наблюдений. Чтобы оценить погрешность полученного таким образом результата, воспользуемся неравенством Чебышева

P{X - A ³ tσ}£ t12 .

Соседние файлы в предмете Метрология