- •Российская академия народного хозяйства и государственной службы
- •Оглавление
- •Тема 1. Элементы комбинаторики
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 2. Случайные события §2.1. Классическое определение вероятности события
- •§2.2. Действия над событиями
- •§2.3. Теорема сложения вероятностей
- •§2.4. Понятие условной вероятности
- •§2.5. Теорема умножения вероятностей
- •§2.6. Формула полной вероятности и формула Байеса
- •§2.7. Повторение испытаний. Формула Бернулли
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 3. Случайные величины и их законы распределения §3.1. Общие определения
- •§3.2. Дискретные случайные величины и основные законы распределения
- •§3.3. Понятие интегральной и дифференциальной функции распределения
- •§3.4. Непрерывные случайные величины и основные законы распределения
- •§3.5. Действия над случайными величинами и основные числовые характеристики
- •§3.6. Неравенство Чебышева и интегральная теорема Муавра — Лапласа
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 4. Введение в математическую статистику §4.1 Основные определения
- •§4.2. Вариационный ряд и статистическое распределение выборки
- •§4.3. Графическое изображение статистического распределения
- •§ 4.4. Выборочные средние и методы их расчета
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 5. Статистические оценки параметров распределения §5.1 Точечные оценки
- •§ 5.2. Интервальные оценки
- •5.2.1. Доверительные интервалы для оценки параметров m и σ2 нормально распределенной генеральной совокупности
- •5.2.2. Доверительные интервалы для оценки разности средних двух нормально распределенных генеральных совокупностей
- •5.2.3. Доверительные интервалы для оценки доли признака
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Тема 6. Статистические гипотезы § 6.1. Основные понятия статистической проверки гипотез
- •§ 6.2. Проверка гипотезы о равенстве дисперсии нормально распределенной генеральной совокупности некоторому значению
- •§ 6.3. Проверка гипотезы о равенстве генеральной средней нормально распределенной генеральной совокупности некоторому значению
- •§ 6.4. Проверка гипотезы о доле признака
- •§ 6.5. Проверка гипотезы о виде распределения генеральной совокупности
- •§ 6.6. Проверка гипотезы о равенстве параметров двух нормально распределенных генеральных совокупностей
- •Контрольные вопросы и задания
- •Список основной литературы
- •Список дополнительной литературы
- •Приложение
- •Значения функции плотности стандартизированного нормального распределения n (0, 1)
- •Значения функции распределения f (0,1)(X) нормального закона n (0,1);
- •Распределение Пуассона
- •Квантили tp распределения Стьюдента
- •Квантили распределения 2(хи-квадрат)
- •Квантили распределения Фишера f0,99(k1, k2)
- •Квантили распределения Фишера f0,975(k1, k2).
- •Квантили распределения Фишера f0,95(k1, k2)
- •Квантили распределения Фишера f0,90(k1, k2)
- •Заключение
- •Евгений Алексеевич Рапоцевич теория вероятностей и мамематическая статистика Учебное пособие
- •630102, Г. Новосибирск, ул. Нижегородская, 6, СибАгс
§4.3. Графическое изображение статистического распределения
Для наглядности статистическое распределение изображают в виде различных графиков. Выделяют несколько видов.
Распределение дискретной случайной величины изображается полигономчастот, который получается следующим образом. По оси абсцисс откладываются наблюдаемые значения x1, x2,..., хkслучайной величиныX, а по оси ординатсоответствующие частоты этих значений n1, n2, …, nk. Полученные точки с координатами (xi, ni) соединяются прямолинейными отрезками. Если в указанном построении вместо частоты берется относительная частота, то получается полигон относительных частот. Два этих графика различаются между собой только масштабом по оси ординат.
Рис.13 Полигон частот
Полигон частот является статистическим аналогом многоугольника распределения для случая дискретного критерия.
Пример.
Имеются следующие данные о размере обуви, проданной магазином за день:
39, 41, 40, 40, 43, 41, 44, 42, 40, 42, 41, 41, 43, 42, 39,
42, 43, 41, 42, 41, 38, 42, 42, 41, 40, 41, 43, 41, 39, 40.
Составим эмпирический закон распределения:
-
xi
38
39
40
41
42
43
44
ni
1
3
5
9
7
4
1
Построим полигон частот (рис.14).
Рис.14 Полигон частот
Для непрерывно распределенного критерия промежуток, в котором заключены все наблюдаемые значения, разбивается на ряд интервалов. Обычно берут интервалы одинаковой длины h. Если количество интервалов разбиенияkзадано, то, гдеxminиxmaxминимальная и максимальная варианты. Если число интервалов не задано, то обычно пользуются следующей формулой:, где [x]целая часть числаx.
Гистограммой частот, соответствующей выборке x1, x2,..., хn, называют ступенчатую функцию, принимающую постоянное значениеni /hнаiм интервале длиныh. Площадь полученной ступенчатой фигуры равнаn.
Гистограммой относительных частот, соответствующей выборке x1, x2,..., хn, называют ступенчатую функцию, принимающую постоянное значениеi /hнаiм интервале длиныh. Тогда площадьiтого прямоугольника равнаi , а площадь полученной ступенчатой фигуры равна единице.
Если количество наблюдений nнеограниченно возрастает, а длина промежутковhстремится к нулю, то гистограмма относительных частот будет приближаться к плотности распределения исследуемого признака. Поэтому гистограмма относительных частот является статистическим аналогом плотности распределения (функции плотностиf(x)).
Рис.15 Гистограмма относительных частот
Задание для самостоятельного решения:
Построить гистограмму и график эмпирической функции распределения выборки из 55 наблюдений, используя 7 интервалов группировки. Выборка:
20,3 15,4 17,2 19,2 23,3 18,1 21,9 15,3 16,8 13,2 20,4 16,5 19,7 20,5
14,3 20,1 16,8 14,7 20,8 19,5 15,3 19,3 17,8 16,2 15,7 22,8 21,9 12,5
10,1 21,1 18,3 14,7 14,5 18,1 18,4 13,9 19,1 18,5 20,2 23,8 16,7 20,4
19,5 17,2 19,6 17,8 21,3 17,5 19,4 17,8 13,5 17,8 11,8 18,6 19,1
§ 4.4. Выборочные средние и методы их расчета
Для характеристики распределения выборки используются различные средние значения. Главнейшими из них являются:
выборочная средняя
выборочная дисперсия
выборочное среднее квадратическое отклонение
исправленная выборочная дисперсия
исправленное выборочное среднее квадратическое отклонение
коэффициент вариации .
Для дискретного распределения случайной величины Xиспользуется первое соотношение первых двух формул, для непрерывного – последующее общее соотношение. Иногда для расчета выборочной средней и выборочной дисперсии непрерывного признака используется группировка данных по интервалам и за значения x1, x2,..., хkв этих формулах берутся, как правило, середины интервалов разбиения (смотри принцип построения гистограммы).
Выборочная средняя является аналогом математического ожидания, что следует из связи относительной частоты и вероятности и сравнения соответствующих расчетных формул. Так же дело обстоит с выборочной дисперсией и выборочным средним квадратическим отклонением. Введем еще ряд менее употребляемых характеристик вариационного ряда.
Модой M0называется варианта, которая имеет наибольшую частоту.
Пример.
Найти моду эмпирического закона распределения.
-
xi
1
4
7
9
ni
5
1
20
6
Мода M0 = 7, так как варианта 7 имеет наибольшую частоту 20.
Медианой ml вариационного ряда называется варианта, которая делит вариационный ряд на две части, равные по числу вариант, т.е. еслиn=2k+1, тоml =xk+1, а еслиn=2k, тоml = (xk+xk+1)/2.
Примеры.
Задан вариационный ряд: 2; 3; 5; 6; 7; тогда ml = 5.
Если мы имеем вариационный ряд: 2; 3; 5; 6; 7; 9; тогда ml = (5+6)/2=5,5.
Задания для самостоятельного решения:
Вычислить моду, медиану, среднее и дисперсию следующих выборок:
7, 3, 3, 6, 4, 5, 1, 2, 1, 3.
3,1; 3,0; 1,5; 1,8; 2,5; 3,1; 2,4; 2,8; 1,3.
Размахом варьированияRназывается разность между наибольшей и наименьшей вариантой:R=xmax-xmin. Таким образом, размах является простейшей характеристикой рассеяния вариационного ряда.
При обработке статистической информации широко используют распределение статистик, вычисляемых по выборке из нормально распределенной генеральной совокупности. Эти распределения связаны с распределениями , Стьюдента и Фишера.