- •Модуль 2. Анализ случайных величин. Основные характеристики, законы распределения
- •2.1 Понятия генеральной совокупности и выборки
- •2.2.1 Дискретные случайные величины
- •2.2.2 Репрезентативность выборки. Сравнение относительных частот в выборке и генеральной совокупности.
- •2.3 Непрерывные случайные величины
- •Лабораторная работа №2.3. Построение гистограммы распределения непрерывной случайной величины
- •Выполнение
- •2.4 Основные характеристики случайных величин ("статистики")
- •2.4.1. Среднее (арифметическое) значение. Математическое ожидание
- •2.4.2. Дисперсия
- •Пример 2.5
- •Свойства дисперсии:
- •2.4.3. Связь дисперсии с математическим ожиданием
- •Лабораторная работа №2.4. Характеристики случайной величины
- •Выполнение
2.3 Непрерывные случайные величины
Случайная величина непрерывна, если ее реализации принимают некоторый континуум возможных значений. (Это предполагает, что их нельзя пересчитать, ставя в соответствие им натуральные числа 1, 2,....) Значения непрерывной случайной величины могут представлять собой отрезок, интервал, луч и т.д.
При больших объемах выборки, содержащей значения некоторой случайной величины, ее элементы группируют по интервалам значений. Для этого интервал выборки, содержащий все ее значения, разбивают на k непересекающихся интервалов,длина которых для удобства расчетов чаще всего выбирается одинаковой и равной размаху выборки, деленному на желаемое число интервалов:
x=S/k (x(n) - x(1))/k
После того, как частичные интервалы выбраны, так же, как и в "точечном" случае, определяют абсолютные частоты - количество элементов выборки п, попавших в j-й интервал,причем элемент, совпадающий с верхней границей интервала относят к последующему интервалу.
Наряду с частотами подсчитываются относительные частоты, накопленные частоты и накопленные относительные частоты. Полученные результаты также записывают в виде таблицы, первая строкакоторой содержитграницы последовательных интервалов(вExcel– значениенижнейграницы, интервал называют карманом), авторая- соответствующие имчастоты (абсолютные, относительные, интегральные относительные частоты). Как и для "точечной" выборки, для выборки, сгруппированной по интервалам по значениям накопленных частот,может быть построенавыборочнаяфункция распределения.
Для наглядного представления выборки часто используют ее графическое отображение - гистограммучастот и гистограмму относительных частот. Любая из этих гистограмм представляет собой кусочно-постоянную функцию, принимающую значенияnj/xилиj/xнаj-м интервале упорядоченной по возрастанию выборки. Эту функцию представляют в виде ступенчатой фигуры, состоящей из прямоугольников ширинойxвысотойnj/x(j/x) , построенных на соответствующих интервалах.
Площадь j-го прямоугольника равна x (nj/x)(илиj), а площадь всей ступенчатой фигуры под графиком гистограммы равна объему выборки (для гистограммы частот) или единице (для гистограммы относительных частот).
Пример 2.3
Рассмотрим гистограмму распределения по росту людей в какой-либо выборке, например студентов одного из институтов:
Таблица 2.4.
Рост x
|
155-160 |
160-165 |
165-170 |
170-175 |
175-185 |
180-185 |
185-190 |
nx/n |
0,07 |
0,15 |
0,20 |
0,25 |
0,18 |
0,10 |
0,05 |
Рисунок 2.1
Высота каждого столбика в изображенной на рисунке гистограмме пропорциональна количеству людей, рост которых попадает в соответствующий интервал. Допустим, что у 250 из 1000 выбранных для обследования студентов рост находится в пределах от 170 до 175 см (170 <X <175). Тогда на гистограмме высота столбика, соответствующего этому интервалу, равнаnj/(nx)=250/(10005).
Если рассматривать рост студентов Xв качестве значений случайной переменнойН,то при достаточно большом числе наблюдений относительные частоты появления значенийxkв интервалеx < X <x+xбудут стремиться к вероятности попадания значений роста в вышеуказанный интервалProb{x < X <x+x}, а относительные накопленные частоты к вероятностиProb{X < x}.
При достаточно большом числе наблюдений относительные частоты появления значений xkв интервалеx < X <x+xбудут стремиться к вероятности попадания значений случайной величины в вышеуказанный интервалProb{x < X < x+x}, а относительные накопленные частоты к вероятностиProb{X < x}, которая является функцией конкретного значенияx и называетсяфункцией распределения FX(x) непрерывной случайной величины X.
Если длину интервала xустремить к нулю, то вероятность попадания в каждый конкретный интервал также будет стремиться к нулю. Однако отношение этой вероятности к длине интервала стремится при этом к так называемой плотности вероятности – функции конкретного значенияx.
Плотность вероятностиможно интерпретировать каквероятность попадания реализации случайной величины X в бесконечно малый интервал, содержащий точку x, в расчете на единицу его длины:
fX(x)=
Более строго, если случайная величина является непрерывной, т.е. принимает любые значения из некоторого интервала, то вероятность того, что она принимает некоторое конкретное значение (точечную вероятность) равна 0, поскольку в любом конечном интервале содержится бесконечное число значений. Однако, функция распределения случайной величины FX(x), определяемая как вероятность того, что случайная величина принимает значение меньше данного числаx
сохраняет смысл и для непрерывной случайной величины. В данном случае это некоторая непрерывная неубывающая функция действительного аргумента х.
В общем случае, разбивая интервал значений непрерывной величины (-, х2) на два интервала (-, х1) и [х1, х2) (одновременные попадания случайной величины в которые являются взаимоисключающими событиями), мы имеем
Prob{-X<x1}+ Prob{x1X<x2}= Prob{-X<x2}.
Отсюда находим, что искомая вероятность попадания непрерывной случайной величины в интервал x1X<x2 равна разности функций распределения этой случайной величины:
Prob{x1X<x2}=Prob{-X<x2}-Prob{-X<x1}Fx(x2) -Fx(x1)
Проводя такие же рассуждения, мы можем найти вероятность попадания непрерывной случайной величины в бесконечно малый интервал х Х < х + x
Prob{xX<x+x}=Prob{-X<x+x}-Prob{-X<x}Fx(x+x) - Fx(x) d Fx(x) Fx(x)dx
В последних двух равенствах мы использовали определение бесконечно малого изменения функции распределения (или дифференциала этой функции). Из найденного соотношения видно, что вероятность попадания непрерывной случайной величины в бесконечно малый интервал xX<x+xбесконечна мала и пропорциональна величине этого интервалаx.Отношение этой бесконечно малой вероятности к бесконечно малой величине интервала имеет конечное значение и характеризует плотность вероятности в точкех.
Итак, плотность распределения вероятности
И, наоборот,