- •Математическая статистика Список литературы
- •Введение
- •1. Понятия о выборочном методе
- •1.1. Задачи математической статистики
- •Основные разновидности задач
- •1.2. Генеральная совокупность и выборка
- •1.3. Статистическая функция распределения
- •1.4. Статистическая плотность вероятности
- •Практические рекомендации при построении гистограммы
1.4. Статистическая плотность вероятности
Полигоном частот называют ломаную, отрезки которой соединяют точки , где xi – варианты выборки, mi – соответствующие им частоты.
При большом числе испытаний n вводится понятие статистической плотности вероятности. При этом наблюдаемые значения группируются по разрядам, т. е. по интервалам . Затем определяется число значений хl, попавших в каждый интервал , и вычисляются частоты . Тогда зависимость между и называется статистическим рядом. Для определения статистической плотности вероятности вычисляются значения . Обычно зависимость между i и оформляют в виде графика: над каждым интервалом строится прямоугольник, высота которого равна . Такой график называют гистограммой.
Можно доказать, что при достаточно большом объеме выборки плотность частоты примерно равна теоретической плотности распределения.
Т аким образом, гистограмма дает ступенчатую аппроксимацию плотности вероятности (рис. 1.2).
Практические рекомендации при построении гистограммы
В каждом разряде должно быть не менее пяти значений СВ. Если значений СВ менее пяти, то два соседних разряда объединяются в один разряд (см. предыдущий пример).
Значение k (количество разрядов) должно быть по возможности больше, но при этом не должны наблюдаться «нерегулярности», т. е. монотонное возрастание, а затем – монотонное убывание (это справедливо для , имеющих один экстремум).
Е сли нерегулярности единичны (обычно в начале и конце распределения), то можно объединить соседние разряды (получатся разряды разной длины) (см. рис. 1.4).
Если значения СВ попали на границу разряда, то их количество делят пополам между смежными разрядами (влево и вправо).
ПРИМЕР. Себестоимость единицы одноименной продукции в условных единицах по предприятиям отрасли характеризуется данными, приведенными в табл. 1.3.
Таблица 1.3
Границы себестоимости ед. продукции, |
(1,6; 2,0) |
(2,0; 2,4) |
(2,4; 2,8) |
(2,8; 3,2) |
(3,2; 3,6) |
(3,6; 4,0) |
Число предприятий, mi |
2 |
3 |
5 |
7 |
8 |
5 |
Требуется построить гистограмму для данного распределения.
РЕШЕНИЕ. Составим статистический ряд и вычислим значения (табл. 1.4). n = 30, i = 0,4.
Гистограмма этого распределения показана на рис. 1.3.
Таблица 1.4
Ii |
(1,6; 2,0) |
(2,0; 2,4) |
(2,4; 2,8) |
(2,8; 3,2) |
(3,2; 3,6) |
(3,6; 4,0) |
= mi / 30 |
0,067 |
0,1 |
0,167 |
0,233 |
0,267 |
0,167 |
= /i |
0,167 |
0,25 |
0,417 |
0,583 |
0,667 |
0,416 |
Р ассмотренный прием обработки опытных данных используется при n порядка нескольких сотен.
1 Корреляция – (лат.) взаимосвязь, взаимозависимость.
2 Ковариация – (лат.) вместе + меняться.
3 статистика (от лат. status) – статус, состояние.