Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВСМЭ Конспект Л е к ц и й.doc
Скачиваний:
50
Добавлен:
10.11.2019
Размер:
944.13 Кб
Скачать

Случайные величины и их законы распределения

Наряду со случайными событиями другим важнейшим понятием теории вероятностей является понятие «случайная величина» (СВ).

Величина – это количественная характеристика результата опыта.

Все величины делятся на две большие группы: неслучайные и случайные.

Неслучайные (детерминированные) – это такие величины, которые в результате опыта принимают заранее определенное, известное значение. Например, время восхода и захода солнца, дата наступления нового года, количество пальцев на руках у новорожденного, число экзаменов и зачётов в семестре.

Случайные (стохастические)– это такие величины, о которых заранее неизвестно, какое значение они примут в результате опыта.

Случайные величины, в свою очередь, могут быть дискретными и непрерывными.

Дискретными называют такие СВ, которые в опыте принимают какое-то одно из множества возможных значений, причем эти значения при желании можно перечислить или пронумеровать, т.е. это множество является конечным. Чаще всего (хотя не обязательно) - это целые, неотрицательные значения. Например, оценка студента на экзамене; количество волос на голове, число работающих в цехе ЭД.

Непрерывными называют такие СВ, которые в опыте принимают какое-то одно из возможных значений, причем количество этих значений даже в очень малом интервале бесконечно велико. Иначе говоря, множество возможных значений непрерывной СВ является несчётным. Например, уровень напряжения в сети, длительность работы ЛЭП до отказа, рост и вес человека, масса авторучки.

Названия случайных величин принято обозначать заглавными буквами латинского алфавита – X, Y; а значения, которые случайные величины принимают в опыте, – строчными - x, y.

Различные значения одной и той же случайной величины наблюдаются не одинаково часто. Например, мужчины носят 42-й размер обуви гораздо чаще, чем 46-й; напряжение в сети гораздо чаще лежит в интервале 215- 225 В, чем в интервале 225 –235 В.

Взаимосвязь между значениями случайной величины и вероятностями их появления устанавливает закон распределения случайной величины. Говорят, что СВ распределена (подчиняется) по тому или иному закону распределения. Существует несколько форм задания закона распределения:

  • в виде таблицы (таблично);

  • виде рисунка (графически);

  • формулой (аналитически).

Способы задания законов распределения случайных величин

Все способы задания законов распределения СВ условно можно разделить на теоретические и статистические. Теоретические законы распределения отражают истинные законы, существующие в природе. Для их установления, согласно закону больших чисел, необходимо переработать близкий к бесконечному объём информации. Практически такие законы устанавливаются на основании ограниченного объёма статистических данных и оформляются теми или иными статистическими способами. Статистические данные часто называют экспериментальными (эмпирическими). Каждый теоретический способ задания закона распределения (ТЗР) имеет статистические аналогии (СтЗР). Рассмотрим эти способы.

Ряды распределения св

ТЗР-1. Ряд распределения СВ

Ряд распределения – это таблица, в которой с одной стороны указаны значения случайной величины, а с другой – их вероятности (табл. 2). В ряду распределения значения СВ располагаются упорядочено – по мере их возрастания.

Между всеми возможными значениями СВ делится суммарная вероятность этих значений, равная единице. Поэтому сумма всех вероятностей ряда распределения равна единице: = 1

Таблица 2. Ряд распределения СВ

Х

х1

х2

х3

..

хi

хn

Р

р1

р2

р3

..

рi

рn

Ряд распределения можно записать только в том случае, если СВ является дискретной, т.е. он является теоретическим способом задания закона распределения дискретной СВ.

Пример 25

Таблица 3. Ряд распределения экзаменационных оценок

Оценка

2

3

4

5

Р

0,10

0,45

0,30

0,15

СтЗР-1. Статистический ряд распределения

Статистический ряд является аналогией теоретического ряда распределения и устанавливает взаимосвязь между значениями СВ, полученными в опыте (их часто называют вариантами), и их статистическими вероятностями (частостями) - pi*. Статистический ряд в целом называют также вариационным рядом.

Так как один и тот же объект может быть охарактеризован с разных сторон (например, для ЛЭП можно одновременно измерить ток, напряжение, активную и реактивную мощность, частоту и др.), то вариационные ряды могут быть одномерными, двумерными, трёхмерными и т.д. В дальнейшем будем рассматривать одномерные вариационные ряды.

В зависимости от того, как много вариант (значений СВ) хi, получено эмпирическим путём статистические ряды подразделяются на негруппированные (безинтервальные) и группированные (интервальные).

СтЗР-1а. Негруппированный вариационный ряд

Этот ряд распределения (табл. 4) используется для описания статистических данных при малом (не более 15…20) числе k наблюдавшихся вариант.

Таблица 4. Негруппированный статистический ряд

Значения СВ (варианты) Х

х1

х2

х3

.

хi

Хk

n - количество

повторений (частоты)

n1

n2

n3

.

ni

nk

Pi* - статистические

вероятности (частости)

p1*

p2*

p3*

.

pi*

pk*

Сумма частот в вариационном ряду равна числу проведенных опытов N:

= N .

Статистическая вероятность вычисляется по формуле: рi*= ni/N. (17)

По аналогии с теоретическим рядом распределения = 1 .

Пример 25

Таблица 5 Вариационный ряд распределения оценок, полученных на экзамене

Оценка

2

3

4

5

Частота ni

9

46

30

12

Частость рi*

0,093

0,474

0,309

0,124

СтЗР-1б. Группированный вариационный ряд

Данный ряд применяется, когда количество вариант (наблюдавшихся в опыте значений СВ) велико. Чаще такое возможно для непрерывных СВ, но не исключено и для дискретных. Если все наблюдавшиеся варианты (а их может быть десятки и сотни) указать в таблице, ряд получится громоздким и неудобным для анализа. Поэтому значения группируются (табл. 6) в разряды (интервалы), что существенно упрощает последующий анализ.

Для заполнения группированного ряда достаточно подсчитать количество наблюдавшихся значений СВ внутри каждого разряда, а затем вычислить статистические вероятности по формуле (17). В случае когда какое-то значения СВ совпало с границами интервала, к частотам каждого из граничных разрядов добавляется по 0,5 наблюдения.

Таблица 6. Группированный статистический (вариационный) ряд

№ разряда

1

2

i

k

Границы разрядов

хi …хi+1

х1...х2

х2...х3

хi...хi+1

хk...хk+1

n – число

наблюдений (частоты)

n1

n2

ni

nk

рi* - статистические

вероятности (частости)

p1*

p2*

pi*

pk*

Количество интервалов, на которые разбиваются все зафиксированные в опыте варианты, выбирается исследователем, и обычно лежит в пределах от 10 до 20. Как правило, ширина интервалов выбирается одинаковой. Однако если количество наблюдений в разряде невелико (до десяти), то ширина разряда может быть увеличена (часто это происходит в крайних интервалах распределения).

Правильный выбор ширины интервала может существенно повлиять на результат исследования. Если интервалы широкие, то количество их уменьшается, и отдельные иногда важные детали закономерности распределения СВ могут быть упущены из рассмотрения. Наоборот, при большом числе разрядов, количество наблюдений в каждом из них получается малым, и случайности, характерные для каждого отдельного наблюдения, будут заметно влиять на результат исследования, искажая его картину.

Целесообразное число интервалов k рекомендуется определять в зависимости от объёма N собранной статистики по формуле Стерджеса:

k = 1 + 3,32 lgN . (18)

Полученный результат округляется до целого и затем с учётом максимальной хМАК и минимальной хМИН вариант находится целесообразная ширина xi разрядов:

xi = (хМАК – хМИН)/k . (19)

Пример 26

При помощи прибора САКН (статистический анализатор качества напряжения) собраны эмпирические данные об уровне напряжения на подстанции. Всего получено 17280 наблюдений. Минимальное зафиксированное значение напряжения uМИН равно 370,2 В, максимальное uМАК 394,2 В. Определить целесообразное количество разрядов, на которые следует сгруппировать статистические данные, и их ширину.

Решение.

По формуле Стерджеса (18) целесообразное число интервалов

k = 1 + 3,32 lgN = 1 + 3,32 lg17280 = 15,07.

Целесообразная ширина разрядов (19)

ui = (uМАКuМИН)/k = (394,2 – 370,2)/15 = 1,6 В.

Для удобства обработки и анализа данных целесообразно иметь по возможности округленные границы интервалов. Поэтому ширину интервала имеет смысл принять равной 1,5 В, а общее число разрядов равным 17. Тогда нижняя граница первого разряда равна 369,5 В, верхняя – 371,0 В, для 2-го – 371,0 В и 372,5 В соответственно и т.д. Границы последнего 17-го разряда – 393,5 В и 395,0 В.

Группированный статистический ряд (табл. 7) записан в общем виде, так как количества наблюдений в различных разрядах в задаче не заданы.

Таблица 7. Группированный вариационный ряд уровней напряжения на подстанции

Напряжение

369,5-371

371-372,5

392-393,5

393,5-395

Частота

n1

n2

nk-1

nk

Частость

p1*

p2*

pk-1*

pk*

ТЗР-2. Многоугольник распределения СВ

Многоугольник распределения (рис. 27)– это графическое оформление ряда распределения. Как и ряд распределения, применяется в качестве теоретического способа задания закона распределения дискретной случайной величины.

На рис.27 значения отдельных вероятностей можно было бы не соединять между собой ломаной линией. Но для увеличения наглядности, чтобы подчеркнуть тенденцию изменения вероятности, их соединяют пунктирными линиями. Пунктирная линия подразумевает, что значения СВ – дискретны, и между значениями х1 и х2 других значений нет.

СтЗР-2. Полигон относительных частот

Полигон относительных частот (рис. 28) представляет собой аналогию многоугольника распределения, и есть ни что иное, как графическое изображение негруппированного статистического ряда.

В нём ломаной линией соединяются точки с координатами (х1; p1*) - (х2; p2*); (х2; p2*) - (х3; p3*) и т.д.

Полигон относительных частот может быть построен и для группированного ряда, тогда отрезки ломаной линии соединяют между собой значения частостей, соответствующие серединам интервалов.