- •Содержание
- •Введение
- •Глава 3. Элементы математической статистики
- •3.1. Выборочный метод
- •3.1.1 Задачи и методы математической статистики
- •3.1.2 Виды выборки
- •3.2. Графическое представление эмпирических данных
- •3.2.1. Эмпирическая функция распределения. Кумулята
- •3.2.2 Полигон и гистограмма
- •3.3. Числовые характеристики вариационного ряда
- •3.4. Статистические оценки параметров распределения
- •3.4.2 Точечные оценки параметров распределения
- •3.4.3. Метод моментов
- •3.4.4 Метод наибольшего (максимального) правдоподобия
- •3.5. Интервальные оценки параметров распределения
- •3.5.1 Доверительная вероятность. Доверительные интервалы
- •3.5.2 Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении
- •3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении
- •3.5.4 Доверительный интервал для дисперсии и среднего квадратического отклонения
- •3.5.5 Доверительный интервал для вероятности успеха в схеме Бернулли
- •3.6. Статистическая проверка статистических гипотез
- •3.6.1 Статистические гипотезы. Основные понятия
3.3. Числовые характеристики вариационного ряда
Пусть подлежит обследованию некоторая генеральная совокупность, например, поступление в Федеральный бюджет налогов плательщиков города Тольятти. Такие поступления (согласно налоговому кодексу РФ) включают единый социальный налог, налог на добавленную стоимость, госпошлину и т.д. Ежегодные социологические исследования – т.е. серии выборок объема n – дают некоторые статистические наблюдения за этим процессом. Пусть из генеральной совокупности произведены все возможные выборки равного объема n и для каждой выборки рассчитаны выборочные средние. Например, произведены выборки за прошедшие k лет. По каждому показателю такие исходные данные могут быть представлены в виде последовательности k-мерных векторов X1, X2, …, Xk,, где Xi – результат обследования в i-ом году. Распределение, полученное из выборки, называют выборочным, а его характеристики – выборочными. Репрезентативность выборки зависит от полноты и достоверности представленной информации.
Поскольку параметры распределения генеральной совокупности являются дискретными (или непрерывными) случайными величинами, то они обладают числовыми характеристиками ДСВ (или НСВ) – математическим ожиданием, дисперсией, модой, медианой, средним квадратическим отклонением, которые находятся по правилам, известным из теории вероятностей. Числовые характеристики генеральной совокупности будем обозначать с сопровождающим индексом: генеральное среднее, генеральная дисперсияDГ, что соответствует математическому ожиданию MX и дисперсии DX некоторой непрерывной или дискретной случайной величины некоторого теоретического распределения.
Так, генеральным средним называется среднее арифметическое значений исследуемого признакаX генеральной совокупности:
.
Для ограниченной генеральной совокупности (N<) генеральное среднее, очевидно, всегда существует.
Генеральной дисперсией DГ называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения :
.
Генеральным средним квадратичным отклонением (стандартом) называется квадратный корень из генеральной дисперсии:
.
Вывод о параметрах генеральной совокупности делается на основе изучения числовых характеристик выборки.
Пусть из некоторой генеральной совокупности произведены серии выборок объема n, причем для каждой выборки рассчитаны выборочные средние. Тогда выборочное среднее также является случайной величиной, все возможные значения которой задают распределение выборочной средней. Полученные значения можно представить в виде ряда распределений выборочных средних и найти среднее значение этого распределения .
Выборочным средним называется среднее арифметическое значений исследуемого признакаX выборки, а выборочной дисперсией DВ называется среднее арифметическое квадратов отклонения наблюдаемых значений признака от .
, .
В дальнейшем обозначение числовых характеристик выборки может встречаться как с индексом, так и без него (по умолчанию).
Рассмотрим некоторые числовые характеристики выборки, представленной вариационным рядом.
Для дискретного вариационного ряда модой Мo называется варианта, которая имеет максимальную статистическую вероятность.
Медианой называется середина распределения, т.е. такая точка, в которой половина принимаемых значений лежит слева от нее, а половина справа. Для дискретного вариационного ряда медиану (Ме) можно найти по формуле:
(3.6)
Коэффициентом вариации V называется отношение выборочного среднего квадратичного отклонения к выборочному среднему:
Т.к. коэффициент вариации – безразмерная величина, то его применяют для сравнения разброса данных тех вариационных рядов, параметры которых имеют различную размерность.
Выборочный метод основан на законе больших чисел и центральной предельной теореме (ч.I, п.2.12.5), согласно которым если генеральная совокупность имеет нормальное распределение, то выборочное распределение также подчиняется нормальному закону распределения. Однако, при достаточно большом объеме выборки распределение выборочных средних подчиняется нормальному закону распределения независимо от того, какой закон распределения имеет генеральная совокупность.
Формулы для вычисления числовых характеристик случайных величин в математической статистике аналогичны соответствующим формулам теории вероятностей.
Формулы для вычисления основных числовых характеристик выборки сведем в таблице 1.
Таблица 1.
|
Вариационный ряд задан последовательностью |
Вариационный ряд задан таблицей абсолютных частот |
Вариационный ряд задан таблицей относительных частот |
Среднее значение выборки | |||
Дисперсия выборки DВ |