- •§1 Основные понятия математической статистики
- •1.1. Выборки и их виды
- •1.2. Группированная выборка
- •1.3. Графическое представление вариации оного ряда
- •1.4. Эмпирическая функция распределения
- •§2 Статистические оценки параметров распределения
- •2.1. Статистические оценки
- •2.2.Точечные оценки выборки
- •2.3. Интервальные оценки
- •2.4. Построение доверительных интервалов.
Математическая статистика
§1 Основные понятия математической статистики
Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются:
1. определение способов сбора и группировки этих статистических данных;
2. разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.;
б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения.
1.1. Выборки и их виды
Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов.
Генеральная совокупность – все множество имеющихся объектов.
Выборка – набор объектов, случайно отобранных из генеральной совокупности.
Объем генеральной совокупности N и объем выборки n – число объектов в рассматриваемой совокупности.
Выборка из генеральной совокупности должна обладать свойствами:
каждый элемент выбран случайно;
все имеют одинаковую вероятность попасть в выборку;
n должно быть настолько велико, насколько позволяет решать задачу с требуемым качеством, т.е. выборка должна быть репрезентативной.
Принято считать, что при п > 60 выборка большая, или репрезентативная, а при п < 60 - малая. Такое деление выборки на большую и малую условно. Разные авторы используют разное пограничное л, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи.
Понятие репрезентативная выборка не всегда можно связать с ее объемом п. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоемкости и стоимости получения наблюдений или измерений для формирования выборки..
Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое количество его экземпляров. Доступного для исследования оборудования может быть еще меньше. Поэтому выборка объемом n, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно малой (п < 60).
Пример. Количество зарегистрированных малых предприятий торговли продуктами питания в городе Новосибирске равно 2436. Для исследования предприятий по объему товарооборота взято 136 предприятий. В данном случае N =2436 - объем генеральной совокупности (все мыслимые предприятия данной категории), п=136 - объем выборки из генеральной совокупности.
Виды выборки:
Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;
Бесповторная – отобранный объект в генеральную совокупность не возвращается.
Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз, х2 – п2 раз, …, хк – пк раз, причем , где п – объем выборки. Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами, а п1, п2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты (частости)
Очевидно, что сумма частот равна объему выборки (выборочной совокупности) n , а сумма относительных частот (частостей) равна единице:
.
Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом:
xi |
x1 |
x2 |
… |
xk |
ni |
n1 |
n2 |
… |
nk |
wi |
w1 |
w2 |
… |
wk |
Пример.
При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1.Составим вариационный ряд: 0,1,2,3,4,5. Статистический ряд для абсолютных и относительных частот имеет вид:
xi |
0 |
1 |
2 |
3 |
4 |
5 |
ni |
3 |
6 |
5 |
3 |
2 |
1 |
wi |
0,15 |
0,3 |
0,25 |
,15 |
0,1 |
0,05 |
Если в статистическом распределении вместо частот (относительных частот) указать накопленные частоты (относительные накопленные частоты), то такой ряд распределения называют кумулятивным.
Накопленная частота представляет собой сумму частот всех значений, от x1 до xi.: Fi = ∑ij=1 nj. По накопленной частоте можно определить, для какой части выборки значения переменной X не превосходят значения xi.