Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК по ТВ и МС

.pdf
Скачиваний:
108
Добавлен:
28.11.2019
Размер:
10.53 Mб
Скачать

8.3. Интервальные оценки числовых характеристик случайных величин

Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности оценок становится очень важным.

Определение 8.4. Интервальной оценкой параметра θ называется числовой интервал (θ(n1) ,θ(n2) ), который с заданной вероятностью γ накрывает неизвестное значение параметра θ (рис.8.1): P(θ(n1) < θ < θ(n2) ) = P{θ (θ(n1) , θ(n2)} = γ.

Рис. 8.1.

Границы интервала (θ(n1) ,θ(n2) ) и его величина находятся по выборочным

данным, т.е. являются случайными величинами в отличие от параметра θ − величины неслучайной. Поэтому правильнее говорить о том, что интервал (θ(n1) ,θ(n2) ) «накрывает», а не «содержит» значение θ. Числа θ(n1) и θ(n2) называ-

ются доверительными границами, интервал (θ(n1) ,θ(n2) ) доверительным интер-

валом для параметра θ. Число γ называется доверительной вероятностью (или

надежностью сделанной оценки).

Сначала задается надежность. Обычно ее выбирают равной 0,95, 0,99 или 0,999. Тогда вероятность того, что интересующий нас параметр попал в интер-

вал (θ(n1) ,θ(n2) ) достаточно высока. Число (θ(n1) (n2) ) / 2 – середина доверитель-

ного

интервала – будет давать значение параметра θ с точностью

(θ(n2)

−θ(n1) ) / 2 . Доверительный интервал (θ(n1) ,θ(n2) ) может накрывать параметр θ

или нет. Именно в таком смысле нужно понимать случайное событие, заключающееся в том, что доверительный интервал накрывает число θ. Величина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от значения доверительной вероятности γ (увеличивается с приближением γ к 1). Очень часто (но не всегда) доверительный интервал выбирается симметричным относительно параметра θ. Наибольшее отклонение оценки θn от истинного значения параметра θ, которое возможно с заданной

доверительной вероятностью γ, называется предельной ошибкой выборки.

101

8.3.1. Доверительный интервал для математического ожидания нормального распределения при известной дисперсии

Пусть случайная величина ξ (можно говорить о генеральной совокупности) распределена по нормальному закону, для которого известна дисперсия

D[ξ] = σ2 . Из генеральной совокупности делается случайная выборка X1, … , Xn объема n, которая рассматривается как совокупность n независимых случайных величин, распределенных так же как ξ. Ранее также обсуждались равенства:

M[X1] =... = M[X n ] = M[X ], D[X1] = ... = D[X n ] = D[X ],

M [ X ] = M [ X ], D[ X ] = D[nX ] .

Случайная величина X также распределена по нормальному закону (см. предложение 4.7). Обозначим неизвестную величину M[ξ] через a и подберем по заданной надежности γ число d > 0 так, чтобы выполнялось условие

 

 

 

P(

 

 

 

 

 

a

 

< d )= γ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(8.8)

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как

 

распределена по нормальному закону N(a, σ2/n), то получаем

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

P(

X a

< d )= P(a d < X < a + d ) = Φ a

 

d

 

a

− Φ a

 

d

 

a = 2Φ d n .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ/ n

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ/ n

 

 

Осталось подобрать d таким, чтобы выполнялось равенство

 

 

 

= γ

или

2Φ d

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

γ

. Для любого γ [0,1] можно по таблице найти такое число (кван-

Φ

 

 

 

=

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

σt .

 

тиль) t, что Φ(t) = γ 2 . Теперь из равенства

 

n

 

= t определим d =

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

Окончательный результат получим, представив формулу (8.8) в виде:

 

 

 

 

 

σt

< a < X +

σt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X

 

 

 

n

 

= γ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Смысл последней формулы состоит в следующем: с надежностью γ довери-

тельный интервал

 

σt

; X +

σt

покрывает неизвестный параметр a = M[ξ]

X

n

 

 

 

 

n

 

генеральной совокупности. Можно сказать иначе: точечная оценка X определяет значение параметра M[ξ] с точностью d = σtn и надежностью γ.

Пример 8.7. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной 6,25. Произведена выборка объема n = 27 и получена выборочная средняя арифметическая x =12 . Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с надежностью γ = 0,99.

102

Решение. Сначала по таблице для функции Лапласа найдем значение t из равенства Φ(t) = γ/ 2 = 0,495 . По полученному значению t = 2,58 определим

точность оценки d = 2,5 2,58/ 27 1,24 . Отсюда получаем искомый доверительный интервал: (10,76; 13,24).

8.3.2. Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии

Пусть ξ – случайная величина, распределенная по нормальному закону с неизвестным математическим ожиданием M[ξ], которое обозначим a. Произведем выборку объема n. Определим среднюю выборочную X и несмещенную выборочную дисперсию s2 по известным формулам. Случайная величина

t =

(X a)

n

распределена по закону Стьюдента с (n – 1) степенями свободы.

s

 

 

 

Задача заключается в том, чтобы по заданной надежности γ и по числу

степеней свободы (n – 1) найти такое число tγ, чтобы выполнялось равенство

 

(

 

a)

 

n

 

 

 

 

 

 

 

X

 

< t

= γ

 

 

 

(8.9)

P

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или эквивалентное равенство

 

 

 

 

 

 

 

s

< a

< X + tγ

s

 

= γ .

(8.10)

P

X tγ

 

 

 

 

 

 

 

n

 

 

 

n

 

 

Здесь в скобках написано условие того, что значение параметра a принадлежит некоторому промежутку, который и является доверительным интервалом, границы которого зависят от надежности γ и параметров выборки X и s.

Чтобы определить значение tγ по величине γ, преобразуем(8.9) к виду

P (X sa) n tγ =1 − γ.

Теперь по таблице процентных точек для случайной величины t, распределенной по закону Стьюдента, по вероятности (1 – γ)/2 и числу степеней свободы (n 1) находим t(1−γ)/2%. Формула (8.10) дает ответ поставленной задачи.

Пример 8.8. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении, равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с надежностью 0,95 доверительный интервал для математического ожидания этой случайной величины.

Решение. Величина (1 – γ)/2 в данном случае равна 0,025. По таблице распределения Стьюдента, при числе степеней свободы, равном 19, находим:

t(1−γ)/2% = 2,093. Вычислим теперь точность оценки: 2,093 11/ 20 =5,148 . Отсюда получаем доверительный интервал: (1994,852; 2005,148).

103

8.3.3. Доверительный интервал для дисперсии нормального распределения

Пусть случайная величина ξ распределена по нормальному закону с неизвестной дисперсией D[ξ]. Делается выборка объема n. Из нее определяется не-

смещенная выборочная дисперсия s2. Случайная величина χ2 = (nD[1X)s]2 рас-

пределена по закону χ2 c (n – 1) степенями свободы. По заданной надежности γ можно найти сколько угодно границ χ12 и χ22 интервалов, таких что

P(χ 2

< χ2 < χ

2 ) = γ.

 

 

 

(8.11)

1

 

 

 

2

 

 

 

 

 

Найдем χ2

и χ2

из следующих условий:

 

1

2

 

1 − γ

 

 

1− γ

 

 

P(χ2 ≤ χ2 )

=

, P(χ2

≥ χ2 ) =

.

(8.12)

 

 

 

1

 

 

2

 

2

2

 

 

 

 

 

 

 

 

 

 

Очевидно, что при выполнении условий (8.12) справедливо равенство (8.11). В таблицах для случайной величины χ2 обычно дается решение уравнения

P(χ2 ≥ χ2q ) = q . Из такой таблицы по заданной величине q и по числу степеней свободы (n – 1) можно определить значение χ2q . Таким образом, сразу находит-

ся значение χ22 в формуле (8.12). Для определения χ12 преобразуем (8.12):

P(χ2 ≥ χ12 ) =1 1 2 γ = 1 +2 γ .

Полученное равенство позволяет определить по таблице значение χ12 . Теперь, найдя значения χ12 и χ22 , представим равенство (8.11) в виде

 

 

2

 

(n

1)s

2

 

 

2

 

 

P

χ

<

 

 

< χ

2

 

= γ .

 

 

 

 

 

 

 

1

 

 

D[X ]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Последнее равенство перепишем в такой форме, чтобы были определены границы доверительного интервала для неизвестной величины D[X]:

 

 

(n 1)s2

< D[X ] <

(n 1)s2

 

= γ .

 

P

χ

 

 

χ 2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

1

 

 

 

 

Отсюда доверительный интервал для стандартного отклонения равен

 

 

 

(n 1)s

 

 

 

(n

 

 

 

 

P

 

<

D[X ] <

1)s

= γ.

(8.13)

 

 

2

χ1

2

 

 

 

 

 

 

 

 

 

 

χ2

 

 

 

 

 

 

 

Пример 8.9. Считаем, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях – случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Несмещенная выборочная дисперсия измерений оказалась равной 22,5.

104

Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с надежностью 98%.

Решение. По числу степеней свободы, равному 19, и по вероятности

(1 0,98) / 2

= 0,01 находим из таблицы процентных точек распределения χ2 ве-

личину χ2

= χ2

 

(19) = 36,191.

Аналогичным

образом

для вероятности

 

 

 

2

1%

 

 

 

 

 

 

 

(1 + 0,98) / 2

= 0,99

получаем χ2

= χ2

(19) = 7,633. Используем формулу (8.13):

 

 

 

 

 

 

 

1

99%

 

 

 

 

 

(n 1)s

=

19 22,5 = 3,437 ,

 

(n 1)s

=

19 22,5

= 7,484 .

 

 

 

 

 

 

χ2

2

 

 

 

 

36,191

 

 

χ12

7,633

 

Отсюда искомый доверительный интервал составляет (3,437; 7,484).

Глава 9. Проверка статистических гипотез

На практике часто приходится на основе выборочных наблюдений проверять различные предположения относительно генеральной совокупности. Процедуру сопоставления выдвинутых гипотез с выборкой и решения вопроса относительно приемлемости этих гипотез называют проверкой гипотез.

9.1. Статистическая гипотеза и общая схема ее проверки

Определение 9.1. Статистической гипотезой называется любое предпо-

ложение о виде или параметрах неизвестного закона распределения.

Примеры статистических гипотез: нормально распределенная случайная величина ξ имеет генеральную среднюю, равную a; нормально распределенная случайная величина ξ имеет дисперсию, равную σ2; выборка (x1, … , xn) взята из нормально распределенной генеральной совокупности.

Проверяемую гипотезу обычно называют основной (или нулевой) и обозначают H0. Наряду с нулевой гипотезой H0 рассматривают альтернативную гипотезу H1, являющуюся логическим дополнением H0. Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Правило, по которому гипотеза H0 отвергается или принимается, называется статистическим критерием.

Определение 9.2. Процедура обоснованного сопоставления высказанной гипотезы с выборкой (x1, … , xn), осуществляемая с помощью того или иного статистического критерия, называется статистической проверкой гипотезы.

Результат такого сопоставления может быть как отрицательным (наблюдения противоречат выдвинутой гипотезе, следовательно, от нее надо отказаться), так и положительным (наблюдения не противоречат высказанной гипотезе, и ее можно принять в качестве одного из решений). Неотрицательный результат проверки гипотез не означает, что высказанное нами предположительное ут-

105

верждение является наилучшим. Могут также существовать другие гипотезы, которые не будут противоречить тем же эмпирическим данным.

Статистические критерии проверки гипотез разнообразны, но у них единая

логическая схема построения критерия, которая укладывается в 5 этапов. Этап 1. Выдвигается основная гипотеза H0.

Этап 2. Задается уровень значимости критерия α. Любое статистическое решение, принимаемое на основе ограниченного ряда наблюдений, сопровождается, хоть и малой, вероятностью ошибочного заключения. Именно в доле случаев α гипотеза H0 может быть отвергнута при условии, что она верна. Такие ошибки называют ошибками 1-го рода.

Или, наоборот, в доле случаев β мы можем принять гипотезу H0, в то время как она ошибочна. Эти ошибки являются ошибками 2-го рода.

При фиксированном объеме выборки n величины вероятностей α или β мы можем выбирать самостоятельно. Если есть возможность сколь угодно увеличивать n, то теоретически можно добиться как угодно малых ошибок α и β при любой фиксированной альтернативной гипотезе H1.

Определение 9.3. Вероятность α допустить ошибку 1-го рода, т.е. отвергнуть гипотезу H0, когда она верна, называется уровнем значимости критерия и определяется как α = P(H1\H0).

Чем весомее для исследователя потери от ошибочного непринятия гипотезы H0, тем меньшее α необходимо выбирать. Обычно пользуются стандартны-

ми значениями α (0,1; 0,05; 0,025; 0,01; 0,005; 0,001).

Пример 9.1. Величина α = 0,05 означает, что в среднем в 5 случаях из 100 при использовании данного статистического критерия будет ошибочно отвергаться справедливая основная гипотеза H0.

Этап 3. Задается некоторая функция результатов наблюдения – критиче-

ская статистика (critical statistics)

 

ψcr = ψ(x1, … , xn),

(9.1)

которая также является случайной величиной и в предположении справедливости H0 подчинена некоторому хорошо изученному (затабулированному) закону распределения с плотностью вероятности pψcr (x) .

Замечание 9.1. Содержательный смысл критической статистики – мера расхождения имеющейся в распоряжении исследователя выборки с основной гипотезой H0. Например, в гипотезе об однородности двух выборок случайных величин ξ и η критическая статистика ψcr суть мера различия между функциями распределения Fξ(x) и Fη(x).

Определение 9.4. Статистикой называется любая (измеримая) функция θ = θ(x1, … , xn) от выборки данных.

106

Этап 4. Из статистических таблиц распределения pψcr (x) находятся про-

центные точки (1 – α/2) 100% и α/2 100% – ψ(1−α/ 2) 100% и ψα/ 2100% , являющиеся соответственно нижней (lower) ψcr.l и верхней (upper) ψcr.u критическими точками (границами). Они делят всю область допустимых значений ψcr на области (рис. 9.1): неправдоподобно малых (I); правдоподобных (II); неправдоподобно больших (III).

Рис. 9.1. График плотности вероятности критической статистики с выделением областей принятия и непринятия гипотезы H0.

Область принятия гипотезы H0 определяется как доверительный интервал для ψcr, который формируется на основе закона распределения статистики ψcr при уровне доверительной вероятности p = 1 – α.

Различают односторонние и двухсторонние критерии. Для односторонне-

го критерия область принятия гипотезы H0 может иметь ограничение только с одной стороны (сверху или снизу). При этом область значений статистики ψcr разбивается на две: область правдоподобных и область неправдоподобно больших или неправдоподобно малых значений. Для двухстороннего критерия область принятия гипотезы H0 имеет два ограничения – сверху и снизу.

Этап 5. Определяется расчетное (calculation) значение критической статистики ψcalc подстановкой в (9.1) конкретных выборочных значений (x1, … , xn) или некоторых функций от них. Если окажется, что ψcalc принадлежит области правдоподобных значений, то гипотеза H0 верна, т. е. не противоречит выборочным данным. В противном случае H0 отвергается с ошибкой 1-го рода α. Отвержение H0 означает, что ψcalc не подчиняется закону распределения pψcr (x) . Ошибка 2-го рода возникает, если принимается H0, в то время когда

она неверна. Ее вероятность β равна β = P(H0\H1).

Вероятность (1 – β) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу H0, когда она неверна, называется мощностью критерия.

Замечание 9.2. Очевидно, что из двух критериев, характеризующихся одинаковой вероятностью α отвергнуть в действительности правильную гипотезу

107

H0, следует предпочесть тот, который сопровождается меньшей ошибкой 2-го рода (или большей мощностью).

Принятие гипотезы H0 в сравнении с альтернативной H1 не означает, что мы уверены в абсолютной правильности H0 или, что высказанное в гипотезе H0 утверждение является наилучшим, единственно подходящим. Просто гипотеза H0 не противоречит имеющимся у нас выборочным данным. Таким же свойством, наряду с H0, могут обладать и другие гипотезы. Более того, возможно, что при увеличении объема выборки n либо при испытании H0 против другой альтернативной гипотезы H2 гипотеза H0 будет отвергнута. Так что принятие ги-

потезы H0 следует расценивать не как раз и навсегда установленный, абсолютно верный содержащийся в ней факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

По прикладному содержанию статистические гипотезы можно разделить на следующие типы: о типе законе распределения исследуемой случайной величины; об однородности выборок; о числовых характеристик случайных величин; о стохастической независимости элементов выборки; об общем виде модели, описывающей статистическую зависимость между признаками.

Ниже рассмотрим основные гипотезы из первых четырех типов. Последняя группа статистических гипотез об общем виде модели статистической зависимости между признаками рассматривается в разделе 3.

9.2. Критерии согласия

Критерии согласия предназначены для статистической проверки гипотез о соответствии эмпирического распределения выборки данных выбранной модели теоретического закона распределения.

Пусть выдвинута гипотеза о том, что случайная выборка из генеральной совокупности может быть описана некоторой моделью с функцией распределе-

ния Fmod(x, Θ), где Θ = (θ1, … , θK) вектор параметров, которые могут быть как известны, так и неизвестны.

Большинство критериев проверки согласия основаны на использовании меры расстояний между анализируемой эмпирической функцией распределения Fn(x), определенной по выборке объема n, и модельной Fmod(x, Θ).

9.2.1. Критерий согласия χ2Пирсона

Критерий согласия χ2Пирсона позволяет осуществлять проверку гипотезы о согласии, когда параметры модели неизвестны. Неизвестные параметры модели могут быть заменены в модели их оценками, полученными по выборке, одним из точечных методов оценивания (см. § 8.1). Критерий согласия χ2Пирсона требует, чтобы:

-количество ni, (i = 1, … , L) попаданий в каждый интервал должно быть не менее 4. В противном случае соседние интервалы необходимо объединить в один, не забывая при этом корректировать L;

108

- выборка должна быть сгруппирована, а ее объем не слишком мал.

 

 

Рассмотрим последовательность критерия согласия χ2Пирсона.

 

 

1-й шаг. Формирование основной и альтернативной гипотез

 

 

 

 

H 0: Fn (x) = Fmod (x,Θ) , H1: Fn (x) Fmod (x,Θ) .

 

 

(9.2)

2-й шаг. Задание уровня значимости α.

 

 

)2

 

L

(n

np

 

3-й шаг. Формирование критической статистики ψcr = i=1

i

i

 

, где

 

npi

 

 

 

 

 

pi = Fmod(xi+1, Θ) Fmod(xi, Θ) теоретическая вероятность попадания в i-й интервал [xi , xi +1]. Предельное распределение ψcr при n имеет вид

L

(n

np

)2

 

lim

i

i

 

= χ2 (L S 1) ,

 

npi

 

n→∞ i=1

 

 

 

где S количество параметров модельного распределения, согласие с которым

проверяется, χ2(L S 1) функция χ2распределения с (L S 1) числом степеней свободы.

4-й шаг. Определение верхней и нижней критических точек по таблице процентных точек χ2распределения:

ψcr.u = χα2

/ 2100% (L S 1),

ψcr.l = χ(21−α/ 2) 100% (L S 1) .

5-й шаг. Определение расчетного значения критической статистики

L

(n

np )2

 

ψcalc =

i

i

.

(9.3)

 

 

i =1

 

npi

 

Если выполняется условие ψcr.l ≤ ψcalc ≤ ψcr.u, то гипотеза о согласии H0 верна с ошибкой первого рода α. В противном случае гипотеза H0 отвергается. Отвержение гипотезы H0 в случае слишком маленьких значений критической статистики, т.е. при ψcalc < ψcr.l, на первый взгляд противоречит здравому смыслу. Однако надо отметить, что ψcalc как статистика также является случайной величиной со своей дисперсией. А значит одинаково неправдоподобными можно считать как слишком большие, так и слишком малые ψcalc.

Причинами возникновения слишком малых ψcalc могут быть как неудачный выбор Fmod(x, Θ) (например, при искусственном завышении числа параметров модели или ошибочной модели), так и некорректное проведение эксперимента при деформировании выборки (например, стремление искусственно «подогнать» эмпирические данные под результат).

Замечание 9.3. Использование критерия основано на теореме Пирсона– Фишера, которая утверждает, что если гипотеза H0 истинна, то при некоторых достаточно общих условиях распределение статистики ψcalc, определяемой по формуле (9.3), сходится (при n ) к χ2(L S 1)распределению.

Замечание 9.4. Критерий согласия χ2Пирсона достаточно эффективен, когда все ожидаемые частоты npi 10, (i = 1, … , L).

109

Пример 9.2. Проверить с помощью критерия χ2Пирсона согласованность эмпирического распределения рабочих по выработке (таблица 9.1), с нормальным законом на уровне значимости α = 0,05.

 

 

 

Таблица 9.1

№№

Выработка в от-

Количество ра-

четном году в % к

бочих, ni

 

предыдущему, xi

 

 

1

94

– 100

3

2

100

– 106

7

3

106

– 112

11

4

112

– 118

20

5

118

– 124

28

6

124

– 130

19

7

130

– 136

10

8

136

– 142

2

 

Всего

 

100

Решение. Параметры нормального закона – математическое ожидание a и дисперсия σ2 неизвестны, поэтому заменяем их на выборочную среднюю x и выборочную дисперсию σ)2 (т.к. число наблюдений n = 100 достаточно велико),

равные x =119,2 и σ)2 = 9,352 = 87,42 .

Для расчета вероятностей pi попадания случайной величины ξ в интервал [xi , xi +1] используем функцию Лапласа:

 

1

xi+1 a

xi a

 

1

xi+1 119,2

 

xi 119,2

 

pi (xi ≤ ξ ≤ xi+1) =

 

Φ

 

 

 

− Φ

 

 

 

Φ

 

 

− Φ

 

.

2

σ

 

σ

2

 

9,35

9,35

 

 

 

 

 

 

 

 

 

 

 

Например, p1 (94 ≤ ξ ≤

100) =

1

100 119,2

 

94

119,2

 

=

 

 

2

Φ

9,35

 

 

− Φ

9,35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 0,5[Φ(2,05) −Φ(2,69)]= 0,5(0,9596 +0,9928) = 0,0166 , и

соответствующая

первому интервалу теоретическая частота np1 =100 0,0166 1,7 и т.д.

Для определения статистики ψcalc удобно составить таблицу 9.2. Учитывая, что в рассматриваемом эмпирическом распределении частоты

первого и последнего интервалов (n1 = 3, n8 = 1) меньше 4, объединим эти интервалы с соседними (см. табл. 9.2). Итак, расчетное значение статистики ψcalc = 2,27. Т.к. новое число интервалов (с учетом объединения крайних) L = 6, а нормальный закон распределения определяется S = 2 параметрами, то число степеней свободы k = L S 1 = 6 2 1 = 3. Верхнее и нижнее критические значения статистики определим из статистической таблицы процентных точек:

ψcr.u = χ20,05

 

(3) = χ2,5%2 (3) = 9,35, ψcr.l = χ2

0,05

(3) = χ97,5%2 (3) = 0,22.

 

 

100%

(1

 

) 100%

2

2

 

 

 

Т.к. ψcr.l ≤ ψcalc ≤ ψcr.u, то гипотеза о выбранном теоретическом нормальном законе N(119,2; 87,42) согласуется с опытными данными.

110