Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Оганесян Введение в физику тяжелых ионов 2008

.pdf
Скачиваний:
200
Добавлен:
16.08.2013
Размер:
7.05 Mб
Скачать

Резюмируем все сказанное в этом параграфе в виде пошагового алгоритма проверки гипотезы о виде распределения генеральной

совокупности с помощью критерия χ2 (Пирсона).

1. Весь диапазон значений исследуемой случайной величины разбивается на несколько (r) интервалов группирования (разбиения) x1 , x2 , …, xr не обязательно одинаковой длины. Это раз-

биение на интервалы необходимо подчинить следующим условиям:

а) в каждый интервал группирования xi должно попасть не

менее 7÷10 выборочных значений, при этом желательно, чтобы в разные интервалы попало примерно одинаковое число точек;

б) общее число интервалов должно быть максимальным при соблюдении условия а);

в) если диапазон значений исследуемой случайной величины — вся числовая прямая (полупрямая), то крайние интервалы группирования будут полупрямыми (соответственно один из них).

2. По выборке x1 , x2 , ..., xn находятся статистические оценки неизвестных параметров θ1 , θ2 , ..., θs , от которых зависит предпо-

лагаемый закон распределения генеральной совокупности, например, методом максимального правдоподобия.

3. Подсчитывается число νi точек, попавших в каждый i-й ин-

тервал группирования xi и вычисляются теоретические вероятности попадания случайной величины в соответствующий интервал, если она распределена с предполагаемой плотностью P(x,θˆ ).

4. Вычисляется «экспериментальное» значение критерия χ2 по формуле:

χexp2 = (νi npnpi )

2

.

r

 

 

i=1

i

 

5. Число степеней свободы χ2 -распределения находится из условия f = r s 1, где r — число интервалов разбиения; s — число

параметров предполагаемого распределения, оцениваемых по той же выборке.

371

6. Из таблиц χ2 -распределения для заданного уровня значимо-

сти α находится критическое значение «хи-квадрат» (имеется в виду таблица, содержащая решения уравнения):

p(χ2 )dχ2 = α .

χ02

7. Проверяется, попадает ли экспериментальное значение χ2 в область допустимых значений критерия. Если χexp2 < χкрит2 , то экспе-

риментальные данные не противоречат проверяемой гипотезе, в противном случае гипотезу следует отвергнуть.

Рассмотрим другой тип гипотез, касающихся предположения о значении некоторого параметра генеральной совокупности.

Пусть имеется выборка из нормальной генеральной совокупности x1 , x2 , ..., xn объема n и найдено выборочное среднее

x = (1 n)xi .

Генеральное среднее X не известно, но есть основания предполагать, что оно равно a0 . Требуется проверить нулевую гипотезу о

равенстве генерального среднего гипотетическому значению a0 , т. е. гипотеза H0 : X = a0. Задача будет рассмотрена для двух частных случаев: а) генеральная дисперсия известна и равна некоторому значению σ02 ; б) генеральная дисперсия не известна и ее надо

оценивать по выборке. В каждом из частных случаев проверка нулевой гипотезы осуществляется с применением различных критериев, а именно: критерия Лапласа (а) и критерия Стьюдента (б).

Отметим, что в обоих случаях критическая область строится в зависимости от выбора конкурирующей гипотезы либо H1 : X a0 (двусторонняя область), либо H1 : X > a0 (правосторонняя), либо

H1 : X < a0 (левосторонняя). Генеральная дисперсия известна.

372

В качестве критерия проверки нулевой гипотезы используется случайная величина u = (x a0 )σ(x ). Здесь x распределено нор-

мально, σ(x ) — среднеквадратичное отклонение случайной вели-

чины,

связанное с дисперсией соотношением σ(x )= σ0

n . При

этом,

если

нулевая гипотеза

верна, то

случайная

величина

u = (x a0 )

n σ0 распределена

нормально

с математическим

ожиданием, равным нулю, и дисперсией, равной 1. Генеральная дисперсия не известна.

Для проверки нулевой гипотезы используется случайная величина

t = xσ(xa)0 ,

где

σ2 (x )= n(n11) n (xi x )2 .

i=1

Можно показать, что t подчиняется распределению Стьюдента с n 1 степенью свободы.

Техника применения критериев аналогична приведенной выше для критерия χ2 .

Гипотезы о значении параметра генеральной совокупности можно проверять при наличии альтернативной гипотезы. Пусть проверяется H0 : X = a0 при наличии альтернативы H1 : X = 2a0 .

На рис. 11.8 представлены распределения проверочной статистики ξ для нулевой и альтернативной гипотез. Назначим критическую область для проверки H0 (справа от ξкрит ) с вероятностью попада-

ния критерия в ту область α. С некоторой вероятностью может произойти событие, состоящее в том, что принята гипотеза H0 , в

то время как верна H1 .

373

Рис. 11.8. Проверка гипотезы H0 относительно альтернативы H1

В этом случае с вероятностью β совершается ошибка второго рода. Чем эта вероятность меньше, чем надежнее различаются конкурирующие гипотезы. Можно ввести параметр 1−β, называемый

мощностью критерия при проверке гипотезы H0 относительно альтернативы H1 . Мощности критерия «1» соответствует достоверное различение конкурирующих гипотез.

11.4. Метод наименьших квадратов

Нередко при анализе экспериментальных данных требуется их сопоставить с соответствующими теоретическими предсказаниями. В частности, речь может идти о сравнении экспериментально полученной функциональной зависимости с аналитической кривой, следующей из теории. Чаще всего теоретическая кривая известна с точностью до вектора параметров, который необходимо оценить по тем же данным и указать погрешность найденных оценок.

Задачу можно сформулировать следующим образом. Пусть в результате измерения некоторой физической величины y, зависящей от x для ряда значений xi , известных точно, получены независимо

друг от друга значения yi (i = 1, 2, ..., n) с погрешностью εi . Все погрешности измерений независимы и имеют нулевое математиче-

374

ское ожидание. Предположим, что экспериментальная зависимость может быть описана (аппроксимирована) выражением

yi = f (xi ,α1,α2 ,...,αk )+ εi ,

(11.10)

где α1, ..., αk — неизвестные параметры функции f. При выбранной зависимости f (x,αG) задача сводится к отысканию вектора пара-

метров, обеспечивающего наилучшее (в выбранной метрике) приближение аппроксимирующей функции (называемой также линией регрессии) к вектору экспериментальных данных.

В регрессионном анализе постулируется выбор среднеквадратичной меры близости, согласно которой расстояние между набо-

ром теоретических точек f (xi ,α1,...,αk ) и набором экспериментальных значений определяется формулой

 

 

S (α1,...,αk )= ωi yi f (xi ,α1,...,αk )

2 ,

(11.11)

где

ωi — статистический вес i-го измерения. Обычно выбирают

ω =1 σ2

, где σ

i

— среднеквадратичная погрешность измерений

i

i

 

 

 

 

yi , которая считается известной.

Естественным рецептом нахождения вектора параметров представляется минимизация статистики S (11.11) по αi , т. е. реализуется принцип «наименьших квадратов». Оценки по методу наименьших квадратов (МНК-оценки) параметров αj могут быть най-

дены как решение системы уравнений

 

 

 

S

= 0 ,

j =1,...,k .

(11.12)

 

 

 

 

 

∂αj

 

 

Пусть функция

f (x,α1,...,αk )

в (11.11) зависит от параметров

αj линейно, т. е.

 

 

 

 

 

 

 

 

 

k

 

 

f (x,α1,...,αk )= ϕj (x)αj .

 

 

 

 

 

j=1

 

Для решения этой

задачи вводится матрица

A, с элементами

Aij = ϕj (xi ) (i = 1, 2, ..., n; j = 1, 2, ..., k). Она называется конструк-

ционной матрицей. Тогда (1.11) запишется в виде

375

AT Wy = AT WAα ,
где AT Gтранспонированная матрица A. Выражая α из (11.15), получаем оценку
αG = (AT WA)1 AWyG .

n

 

k

2

S (α1,...,αk )= ωi yi Aijαj .

i=1

 

j=1

 

Решая систему уравнений (11.12), имеем

n

n

k

 

ωiAik yi = ∑∑ωiAij Aik αj .

(11.13)

i=1

i=1

j=1

 

Для дальнейшего изложения целесообразно перейти к матричной форме обозначений. Введем вектор-столбец α с компонентами α1 , α2 , ..., αk ), вектор-столбец y с компонентами (y1,..., yn )

 

y = Aα .

 

(11.14)

Обозначим через W диагональную матрицу с отличными от ну-

ля элементами ωi :

 

 

 

 

ω ...

0

 

 

1

.

 

W = . .

.

 

0 ...

ω

 

 

 

n

Тогда система (11.13), называемая системой нормальных уравнений, примет вид

(11.15)

(11.16)

Поскольку значения случайных величин yi получены независимо друг от друга и дисперсия yi равна σi2 , то ковариационная матрица (или матрица ошибок) вектора y может быть представлена в виде

G

 

σi2

...

0

 

 

 

. .

 

D(y)= .

.

 

 

0

...

σ2

 

 

 

 

 

n

 

Так как ωi =1/ σi2 , имеем

D(yG)= W1 ,

376

D(αG)= (AT WA)1 .

где W1 — матрица, обратная W.

11.4.1. Свойства МНК-оценок

Оценки параметров α1 , α2 , ..., αk , получаемые с помощью МНК, — случайные величины, поскольку они основаны на результатах измерений случайных величин yi . Используя формулу пере-

носа погрешности, можно получить дисперсионную матрицу вектора параметров

(11.17)

По разным причинам σi , указанные как экспериментальные погрешности yi , могут отличаться от соответствующих истинных

значений. Оказывается, можно получить их независимую оценку по тем же исходным экспериментальным данным.

Пусть известны только отношения дисперсий σi2 σi2+1 — т. е.

значения дисперсий известны с точностью до постоянного множителя. В этом случае целесообразно ввести статистические веса следующим образом:

ωi = σ02 / σi2 ,

где величина σ02 , называется дисперсией наблюдения с единичным

весом.

Оценка дисперсионной матрицы параметров в этом случае будет умножаться на σ02

D(αG)= σ02 (AT WA)1 .

Чтобы получить матрицу ошибок D(αG), необходимо либо знать точно σ02 , либо иметь ее оценку.

Можно показать, что несмещенная оценка σ02 в МНК дается вы-

ражением

 

= VT WV (n k ),

σˆ

02

G

 

 

 

где V — вектор остатков:

G

G

 

 

 

 

V = y

Aα ,

377

Sост — остаточная сумма квадратов невязок, n — число экспери-

ментальных точек, k — число неизвестных коэффициентов аппроксимирующей функции.

Окончательно, несмещенная ковариационная матрица оценок параметров имеет вид:

G

VT WV

T

 

1

 

 

D(α)=

 

(A

WA)

 

.

(11.18)

(n k )

 

МНК-оценки параметров линии регрессии обладают меньшей дисперсией, чем любые другие оценки линейного вида, т. е. являются эффективными. Это утверждение известно под названием теоремы Гаусса—Маркова. Кроме того, МНК-оценки являются состоятельными, а для линейного случая они еще и не смещены.

Покажем, что оценка σˆ 02 может использоваться как критерий

согласия.

Найдем

условия,

при

которых

 

статистика

Sост = V

T

WV = yi

G

2

2

 

 

 

χ

2

. Для это-

 

f (xi ,α)

σi распределена по

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

го требуется, чтобы каждое слагаемое в Sост :

 

 

 

 

 

 

1)

было распределено нормально;

 

 

 

 

 

 

 

2)

со средним «0»;

 

 

 

 

 

 

 

 

 

3)

дисперсией «1».

 

 

 

 

 

 

 

 

 

Для выполнения первого условия требуется, чтобы все yi

были

распределены нормально.

 

 

 

 

G

)

 

 

 

 

 

 

 

 

 

 

 

i

 

 

Второе

условие

выполняется, если

( i

 

т. е.

y

f

x ,α

= 0 ,

yi = f (xi ,αGˆ ). Последнее равенство означает, что выбранная зави-

симость f (x) является «истинным аппроксиматором», проходя-

щим через все yi .

Последнее из условий можно представить так: D(yi )σi2 =1. Равенство выполняется только, если все σi указаны правильно.

Таким образом, при выполнении сформулированных условий статистика Sост распределена по χ2 с n k степенью свободы, дру-

гими словами Sост (n k )~ 1, если вспомнить, что χ2 совпадает с

378

числом степеней свободы и при (n k )>>1 среднее распределения χ2 близко к моде.

11.4.2. Влияние погрешностей в аргументе

Одним из исходных предположений для изложенного выше варианта метода наименьших квадратов было отсутствие погрешности в аргументе аппроксимирующей функции. Пусть теперь и xi

случайные величины, распределение каждой из которых имеет

дисперсию σ2 . Учет этих погрешностей может быть произведен на

xi

основе формулы переноса погрешностей. Так как предполагается, что yi = f (xi ,αG), то

(σ′ )2 = σ2 +(f (x ) x)2 σ2 .

yi yi i xi

В то же время, так как случайные величины y и x независимы, то исходное выражение (11.11) примет вид:

 

 

 

2

 

 

 

n

 

[yi f (xi ,α1,...,αk )]

 

 

 

S (α1,...,αk )=

 

 

 

 

 

. (11.19)

σ2y

+ ∂f (xi ,α1,...,αk )

x

2

 

i=1

 

σ2x

 

i

 

 

 

i

Недостаток соотношения (11.19) заключается в том, что оно в явном виде зависит от функции f (x,α), параметры которой и тре-

буется определить. Проблема обычно решается методом последовательных приближений или использованием алгоритмов численной минимизации многомерных функций (нелинейного программирования).

11.4.3. Неравноточные измерения

Рассмотрим частный случай получения оценки физической величины Y по результатам нескольких неравноточных измерений, т. е. пусть имеется ряд:

y , y

 

, y ,..., y

n

,

(11.20)

1

2

3

 

σ1,σ2 ,σ3 ,...,σn .

 

379

где xi — результат i-го измерения величины Y, выполненного с погрешностью σi ..

Задачу можно переформулировать следующим образом: провести методом наименьших квадратов через точки с известной погрешностью прямую вида y = b , т. е. параллельную оси x. В этом

случае исходное соотношение (11.14) можно представить в виде:

y

 

 

1

 

1

 

 

 

 

 

y2

 

=

1

[b].

 

 

 

 

#

 

 

#

 

 

yn

 

1

 

В соответствии с (11.16) для оценки единственного параметра b имеем:

ˆ

T

WA)

1

G

2

 

1

yi

2

=

wi yi

, (11.21)

b

= (A

 

AWy

= 1/ σi

 

σi

W

 

 

 

 

W = wi , а wi

 

 

 

 

 

где, по определению,

=1/ σi2 . Оценку по формуле

(11.21) называют средневзвешенной. Погрешность оценки, в свою очередь, можно найти по формуле (11.18):

ˆ

T

WV

 

 

 

 

ˆ

2

 

V

T

WA)

1

 

wi (yi b)

 

 

D(b)=

(n k )

(A

 

=

W (n 1)

.

(11.22)

Легко видеть, что при равенстве всех σi , т. е. когда σi = σ0

и σ02

дисперсия генеральной совокупности, выражения (11.21) и (11.22) переходят, соответственно, в известные оценки:

ˆ = yi b

n

— среднее арифметическое,

D(b)=

σ02

.

ˆ

 

 

n

 

11.4.4.Сплайн-МНК

Вэкспериментальной практике часто требуется аппроксимировать некоторую зависимость, полученную в виде набора точек, аналитической кривой, причем вид зависимости заранее не извес-

380