Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мат анализ.doc
Скачиваний:
2
Добавлен:
25.09.2019
Размер:
623.1 Кб
Скачать

4) Поступила информация о том, что высказывание а истинно. (4.25)

Задача 12.

В пирамиде 10 винтовок, из которых 4 с оптическим прицелом. Вероятность того, что

стрелок поразит мишень при выстреле из винтовки с оптическим прицелом равна 0,95; для

винтовки без оптического прицела эта вероятность равна 0,8. Стрелок поразил мишень из

наудачу взятой винтовки. Что вероятнее: стрелок стрелял из винтовки с оптическим

прицелом или без него? Решение:

Пусть а = «стрелок поразит мишень из наудачу взятой винтовки», h\ - «наудачу взятая

стрелком винтовка — с оптическим прицелом», hi = «наудачу взятая стрелком винтовка

— без оптического прицела». По условию задачи:

) = 0,4;

Требования (4.23) и (4.25) выполняются: а может быть истинным лишь при истинности А|

или /i2; f\h\) + P(hi) = 1; есть информация об истинности а.

Используем формулы (4.22) и (4.24):

P(a) = P(h}) PHi(a) + P(h2) />i(e) = 0,4-0,95 + 0,6 0,8 = 0,86;

*, W 0,4-0,95 19

Р(а)

0,86 0,6 • 0,8

24 43

188

'"у'г> ~Р(а) 0,86

(обратим внимание на то, что Pa(hi) + Pa(h\) = 1). Так как /*„№) > Pa(h\), то более

вероятно, что стрелок стрелял из винтовки без оптического прицела.

> Формула Бернулли используется в следующих условиях:

1) проводится п независимых испытаний (независи- ~ мость испытаний означает, что

исход любого из них никаким путем не влияет на исходы других);

2) каждое испытание имеет два исхода: один исход называют «успехом», а другой —

«неудачей»;

3) вероятность р «успеха» в отдельно взятом, или единичном, испытании постоянна и от

испытания к испытанию не меняется (это условие обеспечивается проведением испытаний

примерно в одинаковых, или иначе — в типичных условиях).

189

М4.26)

Испытания, удовлетворяющие условиям (4.26), на зываются испытаниями Бернулли;

формула Бернулли имеет следующий вид

Pn(m) = C:Pmqn-m, (4.27)

где Р„(т) - вероятность появления т успехов в п испы-

п\ таниях (т — О, 1, ..., и), С™ =

--число сочетаний

т 0 1 • • • п

/>» =

=ov

с„уу-° =

= 9"

су<г'=

= и/*Г'

c:Paq- =

= Р"

I"

т\(п — т)\

из п по т, q = 1 — р — вероятность «неудачи» в единичном испытании.

Используя (4.27), рассчитаем вероятности того, что число успехов т — О, 1, 2, ..., я:

(4.28)

Замечание.

Сумма всех вероятностей — это вероятность логически истинного высказывания «при

проведении п испытаний число успехов равно 0 или 1, или 2, ..., или п», поэтому она равна

1.

Ряд (4.28) называют рядом распределения вероятностей Бернулли по числу успехов или

биномиальным рядом распределения.

Число успехов /я*, которому соответствует наибольшая вероятность, называют

наивероятнейшим числом; т" можно найти, не составляя ряда (4.28), следующим образом:

• если пр + р — дробное число, то т* - целое число, лежащее в интервале (пр — q, пр +

р);

• если пр + р — целое число, то наивероятнейших чисел будет два: т\ = пр — q и щ = пр +

р (вероятности этих чисел будут одинаковыми, Рп(щ) = = Рп(т*2), и наибольшими в

сравнении с другими вероятностями ряда (4.28).

Представим, что проведено достаточно много серий испытаний по п испытаний в каждой

серии и в каждой серии зафиксировано число успехов:

190

1-я серия 2-я серия 3-я серия

Число

испытаний в

серии п п п

Число успехов в

серии Щ тг т3

Правомочен вопрос: каково среднее число успехов в одной серии? (Это число обозначим т

, в теории вероятностей его называют математическим ожиданием числа успехов и

обозначают Mm). И далее, поскольку в п испытаниях успехов может быть О, 1, 2, ..., и, то

правомочен вопрос: каков в среднем разброс этих чисел (конечно, с учетом вероятностей

их появления) вокруг среднего числа т . Характеристику этого разброса называют

средним квадратиче-ским отклонением числа успехов и обозначают греческой буквой

стда - «сигма»; иногда в качестве характеристики разброса используют дисперсию числа

успехов Dm = а*т. Для биноминального ряда распределения: т (или Mm) = пр, Dm = npq,

am = -Jnpq . (4.29)

Задача 13.

Примерно 20% судебных дел — это дела по обвинению в краже. В порядке прокурорского

надзора проверено 4 наудачу отобранных дела, а) Какова вероятность появления среди

отобранных дел хотя бы одного дела о краже? б) Каково наиверо-ятнейшее число дел о

краже среди отобранных и какова вероятность этого числа? в) Каковы среднее число дел о

краже и среднее квадратическое отклонение числа дел о краже среди четырех дел?

Решение.

В условиях задачи: число испытаний и = 4, «успех» — наугад взятое дело — это дело о

краже, вероятность успеха р = 0,2, вероятность неудачи q = 0,8.

а) Судя по вопросу, число т успехов может равняться 1, или 2, или 3, или 4, и никак не

может быть равно 0. Так как /КО) + /КО + + />4(2) + /КЗ) + 7*4(4) = 1, то искомая

вероятность Р4(1 < т < 4) = = 1 - /КО) = 1 - С? 0,2°0,84"0= 1 ~ 0,84 = 1 - 0,4096 = 0,5904.

б) Так как пр + р = 4 • 0,2 + 0,2 = 1 — целое число, то наи-вероятнейших чисел будет два:

т\ = пр - q = 4 • 0,2 - 0,8 = 0 и т*г = пр + р = 1. Вероятности этих чисел /КО) = 0,4096, Я4(1)

= с^0,2'0,83 =0,4096 Как и следовало

191

ожидать, вероятности одинаковы, и они будут наибольшими, в чем трудно убедиться,

составив ряд распределения (4.28):

т 0 1 2 3 4

Л(|») 0,4096

0,409

6

0,153

6

0,025

6

0,001

6

1-1

в) Требуемые характеристики вычислим по формулам (4.29): т = пр = 4 • 0,2 = 0,8 ~ таково

среднее число дел о краже среди четырех наудачу выбранных (если наудачу взять 20 дел,

то в среднем среди них будет 4 дела о кражах), v = ^npq = = ^4-0,2-0,8 =0,8- таков в

среднем разброс количеств дел о краже среди четырех наудачу отобранных дел около т =

= 0,8 (для 20 случайно отобранных дел разброс количества дел о краже около среднего

числа, равного 4, будет 1,79).

> Формула Пуассона:

т\

т = 0,1 ..., п

(4.30)

где Р(т) — вероятность появления т успехов в и испытаниях, а = пр, е = 2,71828... -

основание системы натуральных логарифмов. Формула дает хорошее приближение к

вероятностям, рассчитанным по формуле Бернулли (4.27), если число испытаний п велико

(п — несколько сотен), а вероятность р успеха в единичном испытании мала, близка к ну-

лю. Вследствие малости вероятности р формулу Пуассона называют также формулой

редких явлений.

При бесконечно большом числе п испытаний ряд распределения вероятностей Пуассона

по числу успехов или пуассоновский ряд распределения таков:

(4.31)

Обратим внимание на то, что этот ряд, в отличие от биноминального ряда (4.28), —

бесконечный, но сумма его вероятностей, как и для конечного ряда (4.28), равна единице.

При пуассоновском распределении:

• среднее число успехов ( т или Mm) и дисперсия

числа успехов (Dm или сг2т ) равны числу а:

=4а; (4.32)

т 0 1 2

Р(т) ^е-^е- а1 «1е*

2 = 1

0! 1! 2!

т (или Mm) = Dm = а; <з

192

наивероятнейшее число успехов т находят так: если а — дробь, то т целое число из

интервала (а — 1, а); если а — целое, то наивероятнейших чисел два:

= а

1

и

Задача 14.

Примерно 0,1% судебных дел - это дела по обвинению в убийстве. Проверено 200 наудачу

взятых судебных дел. Какова вероятность того, что среди них дел об убийстве будет, а) 0;

1; 2; 3; б) хотя бы одно в) более трех?

Решение.

По условию п = 200, р — 0,001 - есть основания использовать формулу Пуассона; а = пр -

0,2.

а) Требуемые вероятности вычислим по формуле Пуассона (4.30), и для сопоставления те

же вероятности вычислим по формуле Бернулли (4.27) (с точностью до четырех

десятичных разрядов):

т 0 1 2 3

О^т nml ' р-°-2

0

8187

0

163

8

П

П1

Й4

П

ПП1

П

Z — П

QOQO

Л«Ь и, е

/>2М(«) =

С2тм(0,001Г(0,999)200-

'"

0,81

86

0,16

39

0,01

63

0,00

11

X =

0,9999

Различий между вероятностями Пуассона и Бернулли практически нет (они будут тем

меньше, чем больше п и меньше р). Итоговые суммы вероятностей не равны 1, поскольку

по условию задачи число т дел об убийстве может быть равным не только О, 1, 2, 3, но и

4, 5, ..., 200.

б) Судя по вопросу, т может быть равным или 1, или 2, ..., или 200, иначе 1 < т < 200, но

не 0. Поэтому искомая вероятность ^200 (1 <т < 200) = 1 - P2QQ (т = 0) = 1 - 0,8187 =

0,1813.

в) />20о (3 < т < 200) = 1 - Р2оо (0 < т < 3) = 1 - 0,9999 = = 0,0001.

Формулу Пуассона в несколько ином виде, а именно:

ml

где m =0,1,...,

(4.33)

используют для подсчета Pfjri) — вероятности того, что за промежуток времени длиной t

наступит т событий простейшего потока — это поток однородных событий, происходя-

щих в случайные моменты времени, обладающий тремя довольно типичными для многих

ситуаций свойствами:

• одновременное наступление двух или более событий практически невозможно;

• поток установившийся, стационарный с интенсивностью, равной Я (интенсивность -

это среднее

7 Информатика в математика для юристов

193

число событий потока, происходящих в единицу времени);

• поток без последействия, т.е. на вероятность появления любого числа событий в любой

промежуток времени не влияет ни число событий, ни моменты их появления вне этого

промежутка. Задача 15.

При установившейся на протяжении суток криминогенной обстановке в городе в среднем

за сутки происходят 15 правонарушений. Каково наивероятнейшее число правонарушений

за сутки, за 1 час и каковы вероятности этих чисел? Предполагается, что поток

правонарушений простейший.

Решение.

По условию количество правонарушений в сутки X = 15. При / = 1 наивероятнейшее число

правонарушенийт\ -\t-\ =

= 14 и m-J = А/ = 15. Вероятности этих чисел максимальны в

сравнении с вероятностями любого другого количества преступлений и равны:

15!

е~ =

14! 141-15 cyr (15) = 0,102 436. При t = 1 ч = 1/24 сут. наивероятнейшее число

правонарушений - целое число из интервала [15------1, 15 — ]; это число т * = 0. Его

вероятность 1

О!

*= е-*425 =0,535 261.

Биномиальное (4.28) и пуассоновское (4.31) распределения довольно часто используются

в решении задач правоприменительной деятельности, но, конечно, ими не ограничиваются

все возможные распределения вероятностей.

> Понятие случайной величины.

Случайной величиной (СВ) назовем переменную X, множество значений которой

известно, но не известно, какое именно (одно из них) обязательно появится при прове-

дении опыта, иначе - при наблюдении переменной X. Например, СВ является число т

успехов в я испытаниях (множество значений этого числа известно — это {О, 1, 2,

194

..., я}, но каким именно будет число успехов при проведении опыта, состоящего в п

испытаниях, сказать до проведения опыта нельзя). СВ является и число происшедших

событий простейшего потока, с той лишь разницей, что множество значений этого числа

будет не конечным, а бесконечным - {О, 1, 2, ...}. Однако, в обоих случаях значения

величины «изолированы» друг от друга; такую величину называют дискретной. Если

величина может принять любое значение из одного или нескольких отрезков, то ее назы-

вают непрерывной. Так, возраст правонарушителя в принципе может быть любой точкой,

например, на отрезке [14, 80], поэтому возраст — непрерывная величина. Однако, если

возраст измерять полным числом лет, то возраст — дискретная величина.

Говорят, что дискретная СВ X задана, если известно не только множество ее значений, но

и вероятности этих значений; иначе если известно распределение вероятностей по

значениям величины X. Ряд

(4.34)

f i fЈ. ••• jsv ** *

где х\, Х2, ..., xv, — расположенные в порядке возрастания «все» значения СВ X (здесь

предполагается, что число этих значений конечно), а р\, pi, ..., pv , - вероятности этих

значений, называют рядом распределения вероятностей СВ X.

Среднее значение, иначе математическое ожидание С В А' находят по формуле:

МХ= х\р\ + ... + Xvpv, (4.35)

дисперсию СВ X — по одной из двух тождественных формул: DX= (xi - MX)2Pl + (х2 -

МХ)2р2 +...+ (хч - МХ)2рЗ DX = x2Pl + xlp2 + ... + x2Pv - (MX)2 , J (4-36)

среднее квадратическое отклонение СВ X — характеристику среднего разброса значений

СВ X вокруг MX- по формуле:

ax=SDX. (4.37)

Подставив в (4.35) — (4.37) составляющие биномиального ряда распределения (4.28) или

пуассоновского (4.31), можно получить выражения (4.29) или (4.32), со-

X х\ Х2 Xv

р р\ Р2 Pv 1= 1

195

ответствующих характеристик: математического ожидания Mm, дисперсии Dm и среднего

квадратического отклонения ат числа успехов.

Типичным примером непрерывной СВ является нормально распределенная СВ X,

вероятность попадания которой в малый интервал длиной я с центром в точке х

где

(х-МХ)2

— функция плотности распределения «нормальных» вероятностей (ее график изображен

на рис. 4.35); MX, ах - ма-

тематическое ожидание и среднее квадратическое отклонение нормально распределенной

СВ X.

К*)

MX + Зоу х

Рис. 4.35

Для нормально распределенной СВ X

где Ф

ПрИ Z =

196

(4.38)

- значение функции Ф (z) = -/=/е 2 dx

Z 1 1,65 1,96 2 2,58 3

Ф(г) 0,682

7

0,901

1

0,950

0

0,954

4

0,990

1

0,997

3

Таблицы значений этой функции при различных z 2: О имеются, например в [28].

Приведем значения Ф(г) лишь при некоторых z:

(4.39)

В частности при е = За^из (4.38) получим

Р(\Х - МХ\) < 3 ах = Ф(3 ffj/ox) = Ф(3) = 0,9973; (4x10)

геометрически эта вероятность интерпретируется как заштрихованная на рис. 4.35

площадь. Соотношение (4.40) носит название «правила трех сигм» для нормально рас-

пределенной СВ X.

Более подробно с дискретными и непрерывным СВ можно ознакомиться в работах [28,32].

> Формула Лапласа. При большом числе я испытаний вероятность того или иного числа т

(т = 0,1, ..., я) успехов будет малым числом. Так, при стократном подбрасывании монеты

(я = 100) наивероятнейшее число выпадений герба т^пр- 100 • 0,5 = 50, а рассчитанная по

формуле Бернулли (4.27) вероятность этого числа Лоо (50) « 0,08, - и это наибольшая

вероятность; вероятности других чисел будут меньше: например, вероятность P]QQ (40) «

0,00002. В этом случае более ценную информацию дает знание вероятности того, что

абсолютная величина отклонения числа успехов т в я испытаниях от среднего числа

успехов т = яр не превзойдет некоторого заранее заданного числа. Нижнюю границу для

этой вероятности можно получить по формуле:

i i /----- , 1

Р (\m-np\<z Jnpq)2l—г,

11 z

где z — любое положительное число.

Более точное значение вероятности Р(\т --пр\ < z^jnpq) при большом числе я испытаний

дает формула Лапласа:

Р (\m-np\<Z Jnpq) я Ф (Z), (4.41)

При z - 3, учитывая, что ат = -^npq, получим Р(\т-пр\<3ат)*0,9973, т.е. получение в я

испытаниях

197

числа успехов т, абсолютная величина отклонения которого от среднего числа т = пр

будет меньше трех средних квадратических отклонений Зат, является практически

достоверным событием. Это утверждение — «правило трех сигм» для числа успехов т в

большом числе испытаний п.

С неравенством, стоящим в скобках формулы (4.41), проведем такие тождественные

преобразования:

т [рд [рд т [рд

• - '^2- -> -zA— < р-----< zJ— ->

я V п п V и

(4.43)

Окончательно,

— i—л

Ф(г). (4.42)

Относительную долю р = т/п успешных испытаний называют точечной оценкой

вероятности р успеха в единичном испытании, интервал

fm Ipq т IPQ} п \ п' п V п )

—Ф(г)-100%-й интервальной оценкой вероятности р (например, при z = 1,96 получим

95%-ную интервальную оценку), а величину

(4.44)

— ошибкой выборочной вероятности р = т/п.

Замечание.

Напомним, в формулах (4 42) — (4 44) я должно быть доста-1 точно большим числом При

неизвестной вероятности р полагают |

„» т(. т\ pq к рп = — i-----j

п\ п)

В заключение, формулы Пуассона (4.30) и Лапласа' (4.41) вытекают соответственно из

теоремы Пуассона и теоремы Лапласа, с точными формулировками которых можно

познакомиться в работах [32, 52]. Эти теоремы

198

наряду с ранее упоминавшимися теоремами Бернулли и Чебышева, а так же ряд других

теорем, касающихся изучения вероятностного поведения результатов большого числа п

испытаний составляют закон больших чисел.

4.2.4. Выбор решения при неизвестных вероятностях

Выбрать решение в условиях известных вероятностей высказываний довольно просто.

При неизвестных вероятностях, что типично для многих практических задач, выбрать

решение можно лишь на основании экспериментальных данных. Проиллюстрируем

процедуру такого рода.

Следователь X полагает, что он, побеседовав с подследственным, с 90%-ной гарантией

может отличить виновного от невиновного. Его начальник 7 считает, что X такой

способностью не обладает. Кто из них прав? Такой вопрос не возник бы, если

следователю была бы известна истинная вероятность р отличить виновного от невинов-

ного. Однако относительно значения этой вероятности выдвинуто две гипотезы:

• нулевая гипотеза Щ : р = 0,9 (так думает X),

• альтернативная гипотеза Н\: р = 0,5 (так думает Y).

Предлагается провести такой эксперимент. Следователь X беседует с подследственными,

число которых я = = 10, причем начальнику У известно, кто из них виновен, а кто — не

виновен. И если число т правильных ответов будет не меньше 8, 8 < т < 10, то

принимается гипотеза Щ, т.е. правым считается следователь; если 0 < т < 8, то при-

нимается гипотеза Н\, т.е. прав начальник.

Поступив таким образом, можно совершить ошибку двух родов:

• будет принята гипотеза Н\, тогда как на самом деле верной является Щ — это ошибка

первого рода, ее вероятность обозначают а: а = РНо (Н^,

где РНо (Hi), - вероятность принять Н\, если на самом деле верна HQ; а называют уровнем

значимости;

199

• будет принята гипотеза Щ, тогда как на самом деле верна Н\ — это ошибка второго

рода, ее вероятность обозначают р: р = РН{ (Н0).

Правильное решение также может быть двух родов:

• будет принята гипотеза Щ, тогда как на самом деле она верна; вероятность такого

решения

будет принята гипотеза Н\, тогда как на самом де- \\ ле она верна; вероятность такого

решения \'

яанреВПринятая гипотеза

гипотеза Но HI

Н0

РНо(Н0) = 1-а

(правильное

решение)

Ря0(Я,) = а (ошибка

первого рода)

HI

РяДЯоЬР о(шибка

второго рода)

Ря,(Я,)=1-р

(правильное

решение)

Насколько приемлем описанный выше эксперимент для каждой из конфликтующих

сторон?

Следователь X считает, что верна гипотеза Яо: р = = 0,9, и он заинтересован в том, чтобы

по результатам эксперимента Яо была принята, т.е. чтобы при испытаниях и = =10 число

успешных было не меньше 8, 8 < т < 10. Поэтому вероятность «удовлетворения его

интереса» равна:

) = С180 -0,98 -ОД2 +С,90 -0,99 х

Начальник Усчитает, что верна гипотеза Н\: р = 0,5, и он заинтересован в том, чтобы эта

гипотеза была принята, т.е. чтобы при 10 испытаниях число успешных было меньше 8, 0 <

т < 8. Поэтому вероятность «удовлетворения его интереса» равна:

PHi (Я, ) = Рю (0 < т < 8) = 1 - Р(8 < т < 10) =

= 1-(С?0 хО,58 -0,52 +С?0 -0,59 -0,5' +С*0° -0,5ю -0,5°) = 0,945.

Вероятности для Xw. для Y примерно одинаково высоки, поэтому они оба согласятся

разрешить существующие

200

между ними разногласия с помощью описанного выше эксперимента. При таких высоких

вероятностях правильных решений вероятности ошибочных решений невысоки:

вероятность ошибки первого рода равна

а = РЯо(Я1) = 1-РЯо(Я0) = 1-0,93 = 0,07,

а вероятность ошибки второго рода

Р = Рщ (Я0 ) = 1 - РН{ (Я, ) = 1 - 0,945 = 0,055.

Рассмотрим еще одну процедуру выбора решений при неизвестных вероятностях на

основе результатов достаточно большого числа испытаний.

Истинная вероятность р успешности испытания неизвестна. Однако интуиция

подсказывает, что, скорее всего, р равно числу />о- Следует ли принять гипотезу HQ '. р =

Ро или нет?

Для получения ответа на этот вопрос в .«стандартных» схемах проверки гипотез такого

типа требуется:

• во-первых, провести я испытаний Бернулли, зафиксировать число т успешных и найти

их отно-

„ т

сительную долю р = — ; и

• во-вторых, сформулировать, исходя из содержания задачи, альтернативную гипотезу HI

(Н\ : р Ф ро, или Н\ : р </>о, или Н\ : р >р0);

• в-третьих, задать числовое значение вероятности а ошибки первого рода; обычно для а

используются значения: 0,1; 0,05; 0,01; 0,005; 0,001.

Принцип проверки гипотезы Яо такой: если происходит то, что при справедливости Яо

происходить не должно, то Яо отвергают (принимают ЯО; в противном случае — Я0

принимают. Рассмотрим алгоритмы проверки гипотезы Яо : р = PQ для трех видов

альтернативной гипотезы. При этом будем считать, что п достаточно велико.

Если предполагаемое значение ро вероятности р не попадает внутрь интервальной оценки

(4.43) вероятности, чего не должно происходить при справедливости Щ, т.е.

201

если/Jog —-*. и

ТО Яо ОТКЛОНЯЮТ

если OOP —-

(принимают Н\);

(4.45)

п п V п ) то Яо принимают.

Здесь до= l-po, z — число, при котором функция - 1 - а.

2) Я0: р = ро,

т 1Р^±

п то Яо отклоняют (принимают Н\);

1Мо

п то Яо принимают.

Здесь z ~ число, при котором Ф(г) = 1 — 2а.

*j \ y-y t __ y-j- х

т-,

Если р <-----

если

(4.46)

если

(4.47)

~ /И

Если А, > — + л

то Яо отклоняют (принимают

1ы°.

п то Яо принимают.

Здесь z - число, при котором Ф(г) = 1 - 2а.

Рассмотренные алгоритмы позволяют, при заданной вероятности а ошибки первого рода,

получить наименьшую вероятность |3 ошибки второго рода. Принимая гипотезу Яо,

следует понимать, что это вовсе не означает, что Яо является единственно подходящей

гипотезой: просто гипотеза Яо не противоречит результатам испытаний; однако таким же

свойством наряду с Яо могут обладить и другие гипотезы.

202

Задача 16.

Городская статистика раскрываемости преступлений утверждает, что раскрывается

примерно 4 на каждые 10 преступлений. УВД одного из районов утверждает, что за

последний месяц раскрыло 49 преступлений из 100. Случайны ли результаты УВД или

они свидетельствуют о высоком профессионализме его работников?

Принять о = 0,05.

Решение.

Пусть р — вероятность раскрытия преступления районным УВД; ее истинное значение

неизвестно. Известно лишь, что из и =

т = 100 преступлений УВД раскрыло m = 49, т.е. Р = — = 0,49.

Судя по городской статистике, вероятность р оценивается числом Ро = 0,4, а судя по

результатам работы УВД р > 0,4. Поэтому примем HO : р = 0,4, а Н\: р> 0,4 — это случай

2. По условию о = = 0,05. Найдем z, при котором Ф(г) = 1 - 2о = 1 - 2 • 0,05 = 0,90; из (4.39)

z. = 1,65. Далее,

Так как ра = 0,4 < 0,409, то в соответствии с (4.46) принимаем гипотезу Я|, согласно

которой вероятность раскрытия преступления районным УВД больше, чем вероятность в

целом по городу, - это говорит о высоком профессионализме его работников.

Допустим, что вопрос задачи звучит так: случайно или нет отличие результатов УВД от

городских? По-прежнему, примем //о : Р ~ 0,4, но Я] : р * 0,4 — это случай 1. При а = 0,05

Ф(г) = = 1 — а = 0,95 и г = 1,96, интервал

будет таким (0,394; 0,586). Так как

Ро = 0,4 е (0,394; 0,586), то согласно (4.45) гипотезу Щ: р = 0,4 принимаем; считаем что

вероятность раскрытия преступления районным УВД такая же, как и в целом по городу.

Кажущаяся противоречивость этого и ранее полученного выводов объяснятся различием

альтернативных гипотез: здесь Н\:р* 0,4, а ранее Н\:р> 0,4.

4.3. Анализ данных в Microsoft Excel 2000

Пакет «Анализ данных» в Microsoft Excel 2000 включает следующие программы[44]:

1. Однофакторный дисперсионный анализ.

2. Двухфакторный дисперсионный анализ с повторениями.

203

3. Двухфакторный дисперсионный анализ без повторений.

4. Корреляция.

5. Ковариация.

6. Описательная статистика.

7. Экспоненциальное сглаживание.

8. Двухвыборочный jp-тест для дисперсии.

9. Анализ Фурье.

10. Гистограмма.

11. Скользящее среднее.

12. Генерация случайных чисел.

13. Ранг и персентиль.

14. Регрессия.

15. Выборка.

16. Парный двухвыборочный f-тест для средних.

17. Двухвыборочный 7-тест с одинаковыми дисперсиями.

18. Двухвыборочный 7-тест с различными дисперсиями.

19. Двухвыборочный z-тест для средних.

Дадим краткое изложение методов, положенных в основу наиболее часто используемых

программ, приведем соответствующие примеры и интерпретации результатов.

4.3.1. Генеральная совокупность и выборка. Статистический ряд распределения и

выборочные характеристики (Excel — программы №№ 6, 10, 15)

Понятия генеральной совокупности и выборки было введено при изучении

комбинаторной формулы размещений. Расширим эти понятия. Выборкой назовем реально

наблюдаемые значения (в том числе и повторяющиеся) случайной величины X, а все

теоретически домысливаемые значения этой величины назовем генеральной со-

вокупностью. Выборку или наблюдаемые значения СВ X обозначим Х\, Xi, ..., Х„; п —

объем выборки. Замечание.

Если СВ X — булева^, т.е. СВ А'принимает только два значения: 1 - при успешном

испытании, 0 — при неудачном испыта-

Буль Джордж (1815-1864) — английский математик и логик.

204

I

нии, то выборка Х\, Xi, ..., Х„ представляет собой последовательность единиц и нулей, п

— число испытаний (наблюдений СВ X).

> Программа № 15 «Выборка» из чисел рабочего листа — генеральной совокупности

отбирает числа:

• либо в соответствии с введенным периодом I отбора: 1-ое, (1 + /)-ое, (1 + 2/)-ое число и

т.д. (периодическая выборка);

• либо случайным образом, при этом любое из чисел может быть отобрано неоднократно

(случайная повторная выборка); при таком отборе нужно ввести «число выборок» — это

объем выборки п.

Задание генеральной совокупности множеством чисел, среди которых, конечно, могут

быть и повторяющиеся, -исключительный случай. Более употребительным способом

задания генеральной совокупности является указание закона распределения вероятностей

случайной величины X, в частности для дискретной величины — указание ряда рас-

пределения вероятностей.

Основными числовыми характеристиками выборки Х\, Xi, ... Х„, или выборочными

характеристиками, являются:

• выборочная средняя

• (4.48)

п

• выборочная дисперсия DX, которую вычисляют по одной из двух тождественных

формул:

, r TF\2 I тг TF\2

DX =

(х,-х}2+...+(хп-х}2

п

DX =

(4.49)

• выборочное среднее квадратическое отклонение Ьх = -Jbx' — это характеристика

среднего разброса попавших в выборку чисел около выборочной средней.

Аналогичные характеристики генеральной совокупности называют генеральными

характеристиками. Если генеральная совокупность задана рядом распределения

вероятностей случайной величины X, то:

205

генеральная средняя MX, называемая иначе матема-

тическим ожиданием случайной величины X, вы-

числяется по формуле (4.35);

генеральная дисперсия DX вычисляется по одной из

двух тождественных формул (4.36);

генеральное среднее квадратическое отклонение

Замечание.

При изучении по выборке булевой СВ X:

• X — т/П = р , где /7 — общее число испытаний (наблюдений

СВ X), т — число успехов в этих испытаниях, а генеральная средняя MX — р, где р —

вероятность успеха в единичном испытании;

• выборочная дисперсия Ьх = р(\ - р) - pq , а генеральная дисперсия DX — р ( 1 — р) —

pq.

В реальных задачах исследователь располагает, как правило, результатами выборочных

наблюдений (статистическими данными) и не знает «всей» генеральной совокупности.

Вычисленные по этим данным выборочные характеристики являются оценками

соответсвующих генеральных характеристик. Будем предполагать, что наблюдения

независимы и проведены примерно в одинаковых, иначе в типичных, условиях. При

выполнении этих предположений выборочная средняя X является «хорошей оценкой»

генеральной средней MX. Более же «хорошей оценкой» генеральной дисперсии DX,

особенно при малом объеме выборки, является не выборочная дисперсия DX , а так

называемая «несмещенная оценка» генеральной дисперсии, вычисляемая по формуле

(4.50)

л-1

и называемая дисперсией выборки. Величину

sx ~ \sx

(4.51)

называют выборочным стандартным отклонением. 206

Говоря о выборке Х\, Х^, ..., Х„ следует иметь в виду, что это:

• либо конкретные числа, и тогда все выборочные характеристики — это тоже числа;

• либо обозначения тех чисел, которые могли бы попасть в выборку; а поскольку нельзя

заранее предвидеть, какие числа попадут в выборку, то значения выборочных

характеристик не предсказуемы; в этом случае выборочные характеристики — это

случайные величины и, они, как и любая случайная величина, имеют математическое

ожидание и дисперсию. В частности дисперсия выбо-

_

рочной средней DX = - , а выборочная оценка

и

s2 s

этой дисперсии -4 = ~ '•> величину % = -$= х п Jn

называют стандартной ошибкой выборочной средней.

В ряде задач не ограничиваются использованием выборочной средней X в качестве

оценки генеральной средней MX, а строят интервальную оценку генеральной средней —

это интервал

-tn_^-Sx, X + t^^-Sf), (4.52)

который с достаточно высокой вероятностью, равной числу у, накроет генеральную

среднюю (число 4-i,i-v определяется по специальным таблицам критических точек

распределения Стьюдента в зависимости от и-1 и 1-у), т.е.

Р(Х - /_,,,_, -sx<MX<X + tn^_y • ss) = у, (4.53)

тиР(\Х-МХ

Величину

j = у.

называют ошибкой выборочной средней, гарантируемой с надежностью у .

207

Замечание.

Строго говоря формулы (4.52) — (4.54) предполагают, что X — нормально

распределенная СВ.

При неизвестном числовом значении генеральной средней MX гипотезу Щ: MX = a0

(генеральная средняя равна числу до) при альтернативной гипотезе: Н\: MX Ф Ф «о

проверяют так: строят интервальную оценку (4.52) генеральной средней, отвечающую

вероятности у = 1-а, где а- заданное числовое значение уровня значимости; если интервал

(4.52) не накрывает число д0, гипотезу HQ не принимают, в противном случае —

принимают.

Замечание.

При изучении булевой СВ X по выборке достаточно большого объема и формула (4.52)

даст интервальную оценку вероятности р успеха в единичном испытании, а (4.54) даст

ошибку выборочной вероятности p = mln.

> Программа № 6 «Описательная статистика» вычисляет характеристики выборки —

совокупности чисел, введенных в рабочий лист. По умолчанию уровень надежности у

=0,95.

Пример 16.

В ходе исследования рецидивной преступности из документов были собраны данные о

числе повторных судимостей 100 случайно отобранных человек, имевших в прошлом

одну или более судимостей. Среди отобранных не имели повторных судимостей 50

человек, а по остальным — числа повторных судимостей оказались такими: 1, 1, 1, 2, 3, 1,

1, 1, 1, 2, 2, 1, 2, 1, 1, 1, 1, 1, 2, 3, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1,2,2, 1,2, 1,3,4, 1, 1, 1, 1, 1, 1, 1,

1,3, 1, 1.

Распечатка результатов работы «Описательной статистики» приведена на рис. 4.36. В

распечатке наряду с ранее рассмотренными характеристиками приведены:

медиана — число, находящееся в центре ряда данных, расположенных в неубывающем

порядке; если в центре этого ряда будет два числа, то медиана равна средней

арифметической этих чисел;

мода — число, наиболее часто встречающееся в ряду данных;

эксцесс и асимметричность — смысл этих понятий разъясняется на с. 211.

Последнее число в распечатке: 0,175 — это ошибка (4.54) е выборочной средней,

гарантируемая с 95%-й надежностью; в соответствии С (4.53), Р (0,535 < MX < 0,885) =

0,95 - с вероятностью 95% можно утверждать, что интервал (0,535; 0,885) накроет

генеральное среднее число повторных судимостей (узнать это число, вообще говоря,

нельзя: ведь для этого потребовалось бы собрать данные о числе повторных судимостей

не 100 человек, а всех судимых в прошлом). Поскольку найденный

208

интервал не накрывает, например, число 1, то гипотезу Яо: MX ч* о том, что генеральное

среднее число повторных судимостей равно 1 (при альтернативе Н\: МХ*\) принять, на

уровне значимости <х = 1-у =

= 1-0,95 = 0,05, нельзя

Чтобы составить представление о закономерности варьирования чисел в «неизвестной»

генеральной совокупности, результаты выборочных наблюдений группируют.

Продолжим пример 16. Сгруппируем 100 данных о числе повторных судимостей так.

различающиеся наблюдения (их называют вариантами, х,) расположим в порядке

возрастания и для каждого варианта х, укажем число т, — частоту (кратность) вари-

т,

анта и число pt =—'-— частость (относительную частоту, статистическую или опытную

вероятность) варианта:

Число

повторных

судимостей х, 0 1 2 3 4

Итог

о

Количество

человек т, 50 35 10 4 1

я=

100

Опытная

вероятность

р Ч п (число

людей в %)

0,5

(50

%)

0,35

(35

%)

0,1

(10

%)

0,0

4

(4

%)

0,0

1

(1

%)

1

(100

%)

Вероятность

Пуассона*

Р (ОЛ)% -о,,

' СО'

0,49 0,35 0,12 0,0

3

0,0

1

(4.55)

* Содержание этой строки разъясняется далее.

Судя по ряду: рецидивистов с двумя судимостями в 3,5 раза больше числа рецидивистов с

тремя судимостями; в свою очередь число рецидивистов с тремя судимостями в 2,5 раза

больше, чем рецидивистов с четырьмя судимостями

Распределение опытных (статистических) вероятностей по вариантам:

Вариант, х, х\ *2— хе

Опытная вероятность

pl

Р\ Pi - ' Pt 2>i

(4.56)

называют статистическим рядом распределения. Чем этот ряд отличается от ряда

распределения вероятностей (4.34)? В ряду распределения вероятностей указываются все

возмож-

209

ные значения случайной величины и «истинные» вероятности этих значений; в

статистическом ряду указываются значения — варианты, зафиксированные в

проведенных наблюдениях, и опытные вероятности вариантов, которые могут и не

совпадать с истинными вероятностями.

> Программа № 10 «Гистограмма»:

• группирует числа, введенные в рабочий лист, при этом граничные значения —

«карманы» либо вводятся в рабочий лист в возрастающем порядке, либо рассчитываются

автоматически (как точки, равномерно распределенные между минимальным и

максимальным наблюдениями), а частота текущего «кармана» — это число наблюдений,

меньших, или равных, этого «кармана» и больших предыдущего «кармана»;

• подсчитывает по требованию «интегральный %» — это ряд накопленных частостей

(опытных вероятностей) в процентах;

• строит по требованию гистограмму — столбиковую диаграмму частот и график

«интегральных %».

Распечатка результатов «Гистограммы» для 100 данных о' числе повторных судимостей

(см. пример 16) при введенных гра-< ничных значениях О, 1, 2, 3, 4 приведена на рис. 4

37.

Столбец 1

Среднее 0,710

Стандартная ошибка 0,088

Медиана 0,500

Мода 0,000

Стандартное отклонение 0,880

Дисперсия выборки 0,774

Эксцесс 1,709

Асимметричность 1,334

Интервал 4,000

Минимум 0,000

Максимум 4,000

Сумма 71,000

Счет 100,000

Уровень надежности 0,175

(95,0%)

Рис. 4.36

210

Карман Частота Интегральный %

0 50 50,00%

1 35 85,00%

2 10 95,00%

3 4 99,00%

4 1 100,00%

Еще 0 100,00%

Гистограмма

120,00%

» т 100,00%

80,00%

I Частота—»— Интегральный %

Рис. 4.37 Замечание.

Приводимая в распечатке программы «Описательная статистика» (см. рис. 4.36)

асимметричность (А) является характеристикой асимметричности гистограммы (если

правая ветвь длиннее левой, Л > 0; в противном А < 0), а эксцесс (Е) является характе-

ристикой «островершинности» гистограммы по сравнению с нормальной кривой (см. рис.

4.35) (чем больше Е, тем «островер-шиннее» гистограмма). Для нормальной кривой А = Е

= 0.

Продолжим пример 16. Обратим внимание на то, что выборочное среднее число

судимостей (~Х =0,71) примерно равно дисперсии числа судимостей (Sx = 0,77). Это

служит основанием выдвижения гипотезы HQ: СВ X (число повторных судимостей

211

случайно выбранного человека, имеющего в прошлом судимость) имеет пуассоновское

распределение. Напомним, что математическое ожидание Mm (в условиях примера Mm -

это генеральное среднее число повторных судимостей) и дисперсия Dm (генеральная

дисперсия числа повторных судимостей) этого распределения совпадают, см. (4.32).

Пуассоновские вероятности, рассчитанные по формуле (4.30), в которой Mm = а заменено

на выборочную среднюю числа повторных судимостей, а * X = 0,71, приведены в

последней строке (4.55). Пуассоновские вероятности практически не отличаются от

опытных, гипотеза Я0 согласуется с результатами наблюдений.

Для выявления закономерности варьирования наблюдений в случае большого числа

вариантов, что обычно бывает при изучении непрерывной величины (например, времени,

прошедшего между освобождением рецидивиста из мест лишения свободы и

совершением нового преступления) строят интервальный статистический ряд.

Пример 17.

По документам п - 100 рецидивистов собраны сведения о времени X между окончанием

меры наказания за первое преступление и привлечением к наказанию за второе

преступление. Не приводя этих данных, отметим, что число различающихся данных

оказалось достаточно большим, при этом Хтт ~ 0 (рецидивист совершил второе

преступление до окончания меры наказания за первое), а Хтт = 7,5 (лет). Длину Л

интервала группирования сведений определим по формуле Стэрджеса (которая для

многих задач дает оптимальную длину интервала, позволяющую выявить характерные

черты варьирования наблюдений):

Ь —

у _ у

л max mm

7,5

1 + 3,322-log и 1 + 3,322-log 100

~1 (год)-

Сами интервалы будут такими: (Хтт; Хтт + К), (Хтт + А; Хтт + 1 h) ..; построение

интервалов заканчивают как только конец очередного интервала не станет равным или

большим Хтт. В условиях задачи интервалы будут такими: (0; 1), (1; 2), (7; 8). Распечатка

результатов программы «Гистограмма» при введении в качестве карманов чисел 1, 2, 3, ...,

8 приведена на рис. 4.38.

Судя по распечатке у 40 рецидивистов промежуток времени X между преступлениями не

превысил 1 года (Х< 1), у 26 рецидивистов: 1 < X < 2, у 15 рецидивистов: 2 < Х< 3 и т.д.

В ряде задач статистические данные задаются в сгруппированном виде. Формулы

расчета выборочных ха-

212

рактеристик: X, DX, <зх по данным, сгруппированным в статистический ряд, таковы:

-;DX=

где / - число групп ряда, х/ - вариант (центр интервала для интервального ряда).

Карман Частота Интегральный %

\ 40 L

40,00

2 26 66,00

3 15 81,00

4 9 90,00

5 5 95,00

6 3 98,00

7 1 99,00

8 1 100,00

Еще 0 100,00

Гистограмма

45

4С •• 35 • • 30 • • 25 • . 20 • • 15 •• 10 - .' 5 - .)

о -н

,1.1.1.1.

120,00»

• • 100,00»

• • 80,00»

• 60,00»

• • 40,00%

• • 20,00%

• • 0,00»

1 2345678Еи«

Карман

- Интегральный %

Рис. 4.38

Продолжим пример 17. Вычислим среднюю продолжительность X времени пребывания

на свободе и среднее квадратиче-ское отклонение 6Х времени.

Результаты группировки, приведенные на рис. 4.38, запишем в следующую таблицу:

213

Интервал <

Ы

1-

2

2-

3

3-

4

4-

5

5-

6

6-

7

7-

8

Центр

интервала

X,

0,

5

1,5 2,

5

3,

5

4,

5

5,

5

6,

5

7,

5

Частота

/Я/

40 26 15 9 5 3 1 1 п=

100

Опытная

вероятност

ь

т, Р, = — и

0,

4

0,2

6

0,

15

0,

09

0,

05

0,

03

0,

01

0,

01

1=1

Экспоненц

иальная

вероятност

ь р,

0,

41

9

0,2

41

0,

13

9

0,

08

0

0,

04

6

0,

02

6

0,

01

5

0,

00

9

(4.58)

В соответствии с формулами (4.57), X = (0,5 • 40 + ... + + 7,5 • 0/100 = 1,81

(года),___________

Ьх = V(0,52 -40 + ... + 7,52 -1)/100-1,812 = 1,53 (года). Обратим внимание на то, что X « дх

~ свойственно распределениям, построенным по наблюдениям «экспоненциальной» СВ -

это непрерывная СВ X, вероятность попадания которой в малый интервал длиной h с

центром в точке х рассчитывается так:

h} = hte-**, где Х = —• MX

Заменив генеральную среднюю MX на выборочную среднюю X = 1,81, рассчитаем

«экспоненциальные» вероятности попадания времени пребывания рецидивиста на свободе

в соответствующие интервалы, они практически не отличаются от опытных вероятностей.

4.3.2. Сравнение характеристик двух генеральных

совокупностей (Excel — программы № 8, №№ 16—19)

Допустим, что требуется на основании выборочных обследований сравнить два города по

среднему возрасту и «вариабельности» (дисперсии) возраста гражданина впервые

нарушившего уголовное законодательство (или сравнить названные характеристики в

одном городе до и после проведения соответствующих профилактических мероприятий).

Переведем задачу на язык математики.

Введем обозначения:

X, MX, DX — возраст случайно выбранного нарушителя, средний возраст и дисперсия

возраста нарушителя в первом городе соответственно;

Y, MY, DY— аналогичные характеристики для второго города.

Не имея возможности собрать сведения о возрасте всех нарушителей городов, а

располагая лишь выборочными обследованиями: в первом городе собраны данные

214

™1 о возрасте пх нарушителей, а во втором - пу, требуется

проверить гипотезы HQ. MX = MY и Щ: DX = DY о том, что средний возраст нарушителя

в городах одинаков и вариабельность (дисперсия) возраста одинакова.

Алгоритмы проверки гипотез Щ: MX— MY и HQ: DX — = DY реализованы в программах

№ 8, №№ 16-19. Строго говоря, эти алгоритмы предполагают, что:

а) пх наблюдений СВ X (п у наблюдений СВ Y) проведены в типичных условиях;

б) все HX+ и у наблюдений независимы;

в) СВ Х(СБ Y) - нормально распределенная СВ.

Замечание.

Названные программы могут использоваться и для решения^ задач такого типа.

Допустим, требуется сравнить две вероятности: Рх ~ вероятность того, что случайно

выбранный юноша — наркоман и ру — вероятность того, что случайно выбранная

девушка — наркоманка. Не имея возможности обследовать всех юношей и девушек на

предмет употребления наркотиков, собирают сведения о достаточно большом числе Ид-

юношей - это первая выборка, и достаточно большом числе л у девушек — это вторая

выборка Каждая из выборок — некоторая последовательность единиц и нулей: 1 —

обследуемый употребляет наркотики, 0 — не употребляет. По сути в этой задаче речь идет

об изучении двух булевых СВ' X и Y. Поскольку для булевой СВ X математическое

ожидание MX = рх, а дисперсия DX = рх (1 — Рх) ~ РхЯх> то гипотеза Яо: MX = MY

равносильна гипотезе HQ. рх ~ Ру, а гипотеза Щ: DX = /)Уравносильна гипотезе HQ' рхЯх

~ PrtY-

Еще раз обратим внимание на то, что наблюдения булевой СВ - это некоторая

последовательность единиц и нулей

> Программа № 8 «Двухвыборочный F-mecm для дисперсий» используется для проверки

гипотезы HQ. DX = DY (генеральные дисперсии одинаковы). Исходные данные -

введенные в рабочий лист наблюдения переменной 1 (СВ X) и наблюдения переменной 2

(СВ Y), а также уровень значимости а — вероятность отвергнуть верную гипотезу HQ. По

этим данным программа рассчитывает: средние X и Y, дисперсии s2x и s*; и ряд других

величин, необходимых для проверки гипотезы Щ: DX = DY. Среди этих величин: df —

число степеней свободы, которое равно: пх — 1 для переменной 1 и пу — 1 для

переменной 2; F = sf Лу; вероятность «Р одностороннее», называемую «рассчитанным

уровнем значимости»:

215

если «Р одностороннее» > а, гипотезу Яо: DX = DY принимают; если «Р одностороннее» <

а, то Яо не принимают; принимают альтернативную гипотезу Н\, которая может быть двух

видов:

Щ: DX > DY, Щ: DX < DY.

Пример 18.

Выборочные данные о возрасте (полное число лет) граждан, впервые совершивших

уголовные преступления, таковы: 15, 17, 15, 21, 21, 18, 20 - в первом микрорайоне; 25, 16,

19, 24, 19, 20, 21, 23, 23 - во втором. Распечатка результатов программы № 8 при а = 0,05

приведена на рис. 4.39. Вероятность «Р одностороннее» = 0,413 > а, поэтому гипотезу Н0:

DX — ОУ(при альтернативе Н\ : DX < DY, ведь дисперсия sx первой выборки меньше

дисперсии SY — второй выборки) принимаем: генеральная «вариабельность» возраста

нарушителя в обоих микрорайонах одинакова, или различие выборочных дисперсий s% =

6,81 и SY — = 8,361 незначимо, несущественно, связано со случайными ошибками

выборки.

Программы № 16-19 используются для проверки гипотезы Щ: MX — MY = а (разность

генеральных средних равна числу а). В программах число а названо гипотетической

разностью средних; по умолчанию а = 0 и тогда проверяемая гипотеза Я0: MX = MY. При

описании программ примем, не оговаривая особо, что а = 0.

> Программа №17 «Двухвыборочный t-mecm с одинаковыми дисперсиями» используется

для проверки гипотезы только в том случае, когда есть основание считать равными

генеральные дисперсии, DX = DY, хотя числовые значения этих дисперсий и не известны.

В качестве альтернативы к Щ : MX — MY = а при а = О может быть:

Я,: MX > MY; Я,: MX< MY; Я,: MX* MY. Исходные данные программы — наблюдения

величин Хи 7 и вероятность а.

Продолжим пример 18. По данным примера была принята гипотеза Щ: DX = DY

(принятие Щ служит достаточным основанием считать дисперсии равными, но не

означает, что равенство дисперсий — абсолютная истина). Распечатка результатов про-

граммы № 17 при а = 0,05 и «Гипотетической разности средних» = = 0 приведена на рис.

4.40.

216

В распечатке «Объединенная дисперсия» — это оценка генеральной дисперсии обеих

совокупностей, равная x-l) + s*(nr-l) 6.81-6 + 8,36.8

=

1) + К-1) 6 + 8

свободы df= пх+ пу— 2 «= 14, статистика

- =-2,123.

число '

Альтернативой к гипотезе Htf. MX = MY (средний возраст преступника для микрорайонов

одинаков ) может быть:

• гипотеза Я,: MX < MY (ведь X = 18,143 < Y = 21,111); в этом случае Яо принимают,

если рассчитанный «Односторонний уровень значимости» — это вероятность «Р

одностороннее» > а, в противном принимают Н\ («Р одностороннее» = 0,026 < а = 0,05,

поэтому принимаем Н\)\

• гипотеза Н\: MX # MY; в этом случае Щ принимают, если «Р двухстороннее» > а,

в противном случае принимают Н\ («Р двухстороннее» = 0,052 > а = 0,05, принимаем

гипотезу Яо).

Пример показывает, что при неизменной вероятности а отвергнуть верную гипотезу Яо

ответ на вопрос о том, принять или не принять гипотезу Яо, зависит и от вида

альтернативы Н\ .

Приведем описание назначения программ №№ 18, 19, 16; останавливаться на

интерпретации их результатов не будем, поскольку вопрос о том, принять или не принять

гипотезу Яо: MX — MY = а здесь решается так же, как и в программе № 17.

> Программа № 18 «Двухвыборочный t-mecm с различными дисперсиями» используется

для проверки гипотезы Яо: MX — MY = а, когда есть основание считать генеральные

дисперсии неравными: DX Ф DY, хотя числовые значения этих дисперсий и неизвестны.

> Программа № 19 «Двухвыборочный z-mecm для

средних» используется для проверки гипотезы Яо: мх — MY = = а, когда числовые

значения генеральных дисперсий DX и DY известны.

> Программа № 16 «Парный двухвыборочный t-mecm

для средних» используется для проверки гипотезы щ: MX — — MY = а, когда СВ Хи СВ

7 наблюдаются «в паре», т.е. наблюдение — это пара чисел (X^YJ, «снимаемая на одном

объекте»; в этом случае число пх наблюдений СВ X равно числу « у наблюдений СВ Y,

пх— пу