Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекции_по_дисциплине

.pdf
Скачиваний:
464
Добавлен:
09.02.2015
Размер:
2.56 Mб
Скачать

Компьютерное моделирование

ния этой случайной величины, как и для дискретной случайной величины, функцию, определяющую вероятность того, что случайная величина примет значение, меньшее х:

F(x) = P(X<x).

(8.5)

Предположим также, что существует такая функция f(x), что для любых значений х выполняется равенство:

x

 

F(x) f ( )d

(8.6)

 

f(x) = F(x).

из которого также следует:

Функция f(x) называется дифференциальным законом распределения или дифференциальной функцией распределения непрерывной случайной величины. Для того чтобы понять ее смысл, на основании (8.5) и (8.6) рассмотрим вероятность попадания случайной величины в заданный интервал:

b

 

 

P(a<=X<b) = f(x)dx.

(8.7)

 

a

 

 

Приняв х = а, а х + dx = b, получим:

 

x dx

 

 

P(x<=X<x + dx) = f ( )d

=f(x)dx+O(dx).

(8.8)

x

Таким образом, произведение f(x) на dx с точностью до бесконечно малых высших порядков равно вероятности того, что случайная переменная примет значение, заключенное между х и х+dx. Вследствие этого для функции f(x) наряду с термином «дифференциальный закон распределения» употребляют также название «плотность вероятности». Обоснованность этого названия следует из аналогии с плотностью вещества. Например, если рассматривается стержень с переменной линейной плотностью (массы) f(x), то выражение (8.7) дает массу стержня, заключенную в промежутке [а, b], а выражение (8.8) — массу стержня в промежутке [х, х+dx]. Поэтому функция f(x) может быть названа плотностью вероятности, поскольку левые части равенств (8.7) и (8.8) определяют вероятности.

131

Тарова Инна Николаевна

Из того, что вероятность для непрерывной случайной величины принять значение, заключенное между х и х+dx, равна f(x)dx, следует, что вероятность для нее принять некоторое фиксированное точное значение всегда равна нулю, так как при этом следует считать, что dx=0.

Вероятность для любого промежутка [х, x+dx] есть неотрицательная величина, следовательно, и плотность вероятности — неотрица-

тельная функция f(x)>=0. Поскольку lim F(x) = 1, то f(x)dx = 1.

x

(8.9)

Плотность вероятности есть функция, нормированная к единице. Если случайная величина может принимать значения только в промежутке [а,b], то условие нормировки можно написать в виде:

b

f(x)dx=1. Однако его всегда можно приводить и в виде (8.9),

a

имея в виду, что вне промежутка [а, b] плотность вероятности f(x)=0. Произведение f(x)dx есть вероятность, то есть величина безразмерная. Дифференциал dx имеет размерность случайной величины, следовательно, плотность вероятности имеет размерность случайной

величины в степени -1.

График функции F(x) для непрерывного распределения имеет примерный вид, приведенный на рис. 8.2.

Рис. 8.2. Функция распределения непрерывной случайной величины

Непрерывная случайная функция считается заданной, если известна ее функция распределения (F(x) или f(x)).

132

Компьютерное моделирование

8.1.3. Числовые характеристики распределения вероятностей

Числовые характеристики распределения вероятностей полезны тем, что помогают составить наглядное представление об этом распределении. Наиболее часто употребляемыми характеристиками случайной величины (и соответствующего распределения вероятностей) служат моменты и квантили. Дадим их определения для дискретных и для непрерывных случайных величин. Начнем с так называемого первого момента случайной величины , называемого также

математическим ожиданием, или средним значением . Его обозна-

чают через М , или E .

Математическим ожиданием дискретной случайной величины со значениями х1,..., имеющих вероятности р12,..., является

М = xk pk

k

Если число возможных значений конечно, то М , всегда существует и не зависит от способа нумерации этих значений. В том случае, если число возможных значений счетно, необходимо, чтобы сумма ряда xkpk не зависела от нумерации значений х, то есть чтобы

k

этот ряд сходился абсолютно: xk pk

k

Математическим ожиданием непрерывной случайной величины

b

с плотностью р(х), является М = xp(x)dx, причем интеграл дол-

a

жен сходиться абсолютно.

Приведенные определения M , не являются исчерпывающими, поскольку пригодны не для всех видов случайных величин. Универсальные (пригодные для любых случайных величин) определения этих характеристик требуют весьма сложного математического аппарата (они основаны на теории меры, интеграла Лебега-Стилтьеса и т. д.).

Перечислим без доказательства основные свойства математического ожидания:

133

Тарова Инна Николаевна

1.Математическое ожидание постоянной равно этой постоянной.

2.Математическое ожидание суммы случайных величин равно

сумме их математических ожиданий, то есть М( + n) = М + Мn.

3. Математическое ожидание произведения случайной величины на константу равно произведению этой константы на математическое ожидание случайной величины, то есть Ма = аМ (другими словами, постоянный множитель можно выносить за знак математического ожидания).

Кроме математического ожидания случайной величины, которое в определенном смысле характеризует центр распределения вероятностей, представляет интерес и разброс случайной величины относительно этого центра. Для оценки данного разброса в теории вероятностей используют второй центральный момент случайной величины. Его называют дисперсией и обычно обозначают через D .

Дисперсией D , случайной величины называется величина D =

М( -М)2 или D = M 2-(M )2

Дисперсия, так же как и математическое ожидание, существует не для всех случайных величин (не для всех распределений вероятностей). Если необходимо, чтобы показатель разброса случайной величины выражался в тех же единицах, что и значение этой случайной

величины, то вместо D, используют величину D , которая называется средним квадратическим отклонением (стандартным отклонением) случайной величины .

Из свойств дисперсии отметим следующие:

1.Дисперсия постоянной равна нулю.

2.Для любой неслучайной постоянной а

D( + a) = D , D(a) = a2D()

Кроме первого и второго моментов, при описании случайных величин иногда используются и другие моменты: третий, четвертый и т. д.

Дадим их определения отдельно для дискретных и для непрерывных случайных величин.

134

Компьютерное моделирование

Для дискретной случайной величины k-м моментом со значениями x1 ,x2,... .имеющих вероятности р1,р2,..., называется величина

xi k pi

i

(xi-Mx)kpi

а k-м центральным моментом —

 

i

Для непрерывной случайной величины с плотностью р(х), k-м мо-

ментом называется величина xk p(x)dx,

а k-м центральным моментом (x-Mx)kp(x)dx

Чтобы приведенные формулы имели смысл, требуется, чтобы суммы и интегралы сходились абсолютно. Так же как математическое ожидание и дисперсия, моменты существуют не для всех случайных величин.

В отличие от обычных моментов, центральные моменты не меняются при прибавлении к случайной величине постоянного слагаемого, то есть они не зависят от выбора начала отсчета в шкале измерения случайной величины. Но от выбранной единицы измерения зависимость остается: если, скажем, случайную величину начать измерять не в метрах, а в сантиметрах, то значения центральных моментов также изменятся. Иногда это бывает неудобно. В таких случаях, чтобы устранить подобное влияние, моменты тем или иным способом нормируют, например, деля их на соответствующую степень среднего квадратического отклонения. В результате получается безразмерная величина, не зависящая от выбора начала отсчета и единиц измерения исходной случайной величины.

Чаще всего из нормированных моментов используются асимметрия и эксцесс — соответственно третий и четвертый нормированные центральные моменты. Для случайной величины асимметрия вы-

считывается по формуле:

M ( M )3

, а эксцесс —

M ( M )4

(D )3 / 2

(D )2

 

 

135

Тарова Инна Николаевна

Принято считать, что асимметрия в какой-то степени характеризует несимметричность распределения случайной величины, а эксцесс

— степень выраженности «хвостов» распределения, то есть частоту появления удаленных от среднего значений. Иногда значения асимметрии и эксцесса используют для проверки гипотезы о том, что данные (выборка) над которыми велось наблюдение, принадлежат заданному семейству распределений, например нормальному. Так, для любого нормального распределения асимметрия равна нулю, а эксцесс — трем.

Для случайных величин, принимающих вещественные значения, часто используются такие характеристики, как квантили.

Квантилью хр случайной величины, имеющей функцию распределения F(x), называется решение хр уравнения F(x) =p, где р — заданная вероятность.

Величина хр часто называется р-квантилью или квантилью уровня р распределения F(x). Среди квантилей чаще всего используют ме-

диану и квартили распределения.

Медианой называется квантиль, соответствующая значению р = 0,5. Верхней квартилью называется квантиль, соответствующая значению р = 0,75. Нижней — квантиль, соответствующая значению р =

0,25.

В описательной статистике нередко используют децили, то есть квантили уровней 0,1; 0,2;...; 0,9. Значение децилей позволяет неплохо представлять поведение графика у = F(x) в целом.

Отметим, что уравнение F(x) =p, определяющее р-квантили, для некоторых значений р, 0<p< 1, может не иметь решений либо иметь неединственное решение. Для соответствующей случайной величины это означает, что некоторые р-квантили не существуют, а некоторые определены неоднозначно.

В MS Excel для вычисления некоторых числовых характеристик дискретных распределений вероятностей могут быть использованы специальные функции СРЗНАЧ, ДИСПР, СТАНДОТКЛОНП, КВАРТИЛЬ и ПЕРСЕНТИЛЬ.

СРЗНАЧ — вычисляет математическое ожидание для всей сово-

136

Компьютерное моделирование

купности значений дискретной случайной величины;

ДИСПР— позволяет оценить дисперсию дискретного распределения;

СТАНДОТКЛОНП — вычисляет стандартное отклонение дискретного распределения;

КВАРТИЛЬ — позволяет определить квартили распределения. Функция КВАРТИЛЬ имеет формат КВАРТИЛЬ (массив; значение). Массив представляет собой интервал ячеек, содержащих все значения дискретной случайной величины, или сами значения, а значение определяет, какая квартиль должна быть найдена (0 — минимальное значение распределения, 1 — нижний квартиль, 2 — медиана, 3 — верхний квартиль, 4 — максимальное значение распределения).

ПЕРСЕНТИЛЬ позволяет получить р-квантили заданного распределения.

8.2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

Зная распределения вероятностей интересующих нас случайных величин, можно делать выводы о событиях, в которых участвуют эти величины. Правда, эти выводы будут также носить случайный характер.

Среди всех вероятностных распределений есть такие, которые на практике используют особенно часто. Эти распределения детально изучены, и свойства их хорошо известны. Многие из этих распределений лежат в основе целых областей знания — таких как теория массового обслуживания, теория надежности, теория измерений, теория игр и т. п.

Большинство применяемых на практике распределений являются дискретными или непрерывными. Среди дискретных распределений наиболее важные — биномиальное и пуассоновское, среди непрерыв-

ных — нормальное, показательное и распределения, связанные с нормальным: Стьюдента, хи-квадрат и F-распределение Фишера. Далее будут рассмотрены некоторые из наиболее важных распределений вероятностей.

137

Тарова Инна Николаевна

8.2.1. Биномиальное распределение

Биномиальное распределение — это одно из самых распростра-

ненных дискретных распределений, оно служит вероятностной моделью для многих явлений. Оно возникает в тех случаях, когда нас интересует, сколько раз происходило некоторое событие в серии из определенного числа независимых наблюдений (опытов), выполняемых в одинаковых условиях. При этом распределении разброс вариант (в простейшем случае есть событие или нет события) является следствием влияния ряда независимых и случайно сочетающихся факторов.

Примером дискретной случайной величины, подчиняющейся биномиальному закону распределения, является число появлений события А при выполнении п испытаний. Возможными значениями этой случайной величины т являются 0,1,2,.., n.

Если для каждого отдельного испытания ввести случайную величину , которая может принимать только два значения — 1 с вероятностью р и 0 с вероятностью q=(1-р), то соответствующие вероятности появления т успешных (то есть 1) случайных величин вычисляются по формуле:

p

(m)

n!

p m q n m C m p m q n m

(8.10)

 

 

n

 

m!(n m)!

n

 

 

 

 

 

Формула (8.10) называется формулой Бернулли. Условие равенства суммы всех вероятностей единице (8.3) легко проверяется. В самом деле, поскольку (8.10) представляет собой выражение для общего члена разложения бинома Ньютона, то, имея в виду, что р+q=1, находим:

n

n

n!

 

pn

(m)

p m q n m ( p q)n 1

 

 

m!(n m)!

m 0

m 0

 

 

 

 

Таким образом, выражение (8.10) определяет распределение случайной величины — числа появлений события А при п испытаниях. Это распределение, вследствие того, что оно имеет такой же вид, как и общий член разложения бинома Ньютона, называют биномиальным распределением.

138

Компьютерное моделирование

Если число испытаний п велико, а вероятность р реализации события А в одном испытании не очень близка к нулю и не очень близка к единице, то маловероятно, чтобы событие А при п испытаниях случилось очень малое число раз или число раз, близкое к п. Очевидно, что при т, равном малому числу единиц, вероятность pn(т) растет с увеличением т, а для т, близких к п, она убывает при увеличении т.

Математическое ожидание и дисперсия случайной величины, имеющей биномиальное распределение, соответственно, равны:

MA=np, DA=np(1-p) (8.11)

Эти выражения легко получить, если А представить в виде:

A= 1+ 2+…+ n

где случайные слагаемые в данной формуле статистически независимы и одинаково распределены. Для любого k от 0 до п выполняется M k=p, D k=p(1-p), поэтому, согласно свойствам математического ожидания и дисперсии («Числовые характеристики распределения вероятностей»): MA = пМ , DA = nD , что и приводит к указанным выше выражениям (8.11).

При большом количестве испытаний биномиальное распределение стремится к нормальному (рис. 8.3).

Рис. 8.3. Биномиальные распределения при различных р и п

Примером практического использования биномиального распределения может являться контроль качества партии фармакологического препарата. Здесь требуется подсчитать число изделий (упаковок), не соответствующих требованиям. Все причины, влияющие на качество препарата, принимаются одинаково вероятными и не зависящими друг от друга. Сплошная проверка качества в этой ситуации

139

Тарова Инна Николаевна

не возможна, поскольку изделие, прошедшее испытание, не подлежит дальнейшему использованию. Поэтому для контроля из партии наудачу выбирают определенное количество образцов изделий (п). Эти образцы всестороннее проверяют и регистрируют число бракованных изделий (т). Теоретически число бракованных изделий может быть любым, от 0 до п, но вероятности этих чисел различны. В основе принятия решения лежит сравнение распределения результатов контроля, то есть данных, полученных опытным путем, и теоретического распределения, при котором гарантируется необходимое качество всей партии — достаточно низкая вероятность брака P(m<k), где k — предельное число бракованных изделий.

В Excel для вычисления вероятности отдельного значения биномиального распределения или значения случайной величины по заданной вероятности используются функции БИНОМРАСП и КРИТБИНОМ.

Функция БИНОМРАСП применяется для вычисления вероятности в задачах с фиксированным числом тестов или испытаний, когда результатом любого испытания может быть только успех или неудача, испытания независимы, и вероятность успеха постоянна на протяжении всего эксперимента.

Функция использует следующие параметры — БИНОМРАСП

(число_успехов; число_испытаний; вероятностъ_успеха; интегралъ-

иая). Здесь:

число_ успехов — это количество успешных испытаний;

число_испытаний — это число независимых испытаний. При этом число успехов и число_испытаний являются целыми числа-

ми;

вероятность_ успеха — это вероятность успеха каждого испытания;

интегральная — это логическое значение, определяющее форму функции. Если аргумент интегральная имеет значение ИСТИНА (1), то функция БИНОМРАСП возвращает интегральную функцию распределения, то есть вероятность того, что число успешных испытаний не менее значения аргумента число_ успехов; если

140