- •Курс лекций Лекция 1 : Предмет математической статистики. Статистические ряды распределения
- •1.1. Какие закономерности познает математическая статистика
- •1.2 Основные понятия и термины математической статистики
- •1.2.1 Статистическая совокупность
- •1.2.2 Признаки и их классификация
- •2.1 Ранжированный ряд распределения
- •2.1.1 Сущность ранжированного ряда распределения .Табличное и
- •2.1.2 Аналитические возможности ранжированного ряда распределения.
- •2.2 Вариационные ряды распределения
- •2.2.1. Вариационный ряд распределения для дискретного призна
- •2.2.2 Интервальный вариационный ряд распределения
- •2.2.3 Вариационный ряд распределения по качественному признаку
- •2.2.4 Аналитические возможности вариационных рядов распределения
- •2.2.5 Распределение накопленных частот
- •1.1. Система показателей для количественной характеристики статистических распределений.
- •1.2.1 Виды показателей центральной тенденции
- •1.2.3 Средняя гармоническая
- •1.2.4 Средняя геометрическая
- •1.2.5 Мода и медиана
- •1.3 Показатели вариации
- •1.3.1 Размах вариации
- •1.3.2 Среднее линейное отклонение
- •1.3.3 Объем вариации, дисперсия, стандартное отклонение
- •1.3.4 Коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.
- •1.3. 5 Математические свойства показателей вариации
- •1.4 Показатели ассиметрии распределения
- •1.5 Показатели эксцесса распределения
- •2.1 Закон сложения ( разложения ) вариации
- •2.2 Показатель эффективности разбиения на группы
- •1.1. Сущность и необходимость использования выборочного наблюдения
- •1.2 Основные понятия выборочного наблюдения
- •2.1 Ошибки систематические и случайные
- •2.2 Конкретная, средняя и предельная ошибки выборки
- •3.1 Два типа задач решаемых на основе выборочного метода.
- •3.4 Определение вероятности появления заданной ошибки
- •1.2 Общая схема проверки гипотез
- •2.1 Проверка гипотез относительно средних по данным двух независимых выборок
- •2.2 Проверка гипотезы относительно средней по данным двух зависимых выборок
- •2.1 Конкретизация результатов дисперсионного анализа
- •2.2 Модели дисперсионного анализа
- •1.3 Интерпретация коэффициентов уравнения связи
- •2.1 Показатели тесноты связи
- •2.2 Оценка выборочных показателей связи
- •К расчету показателей центральной тенденции
- •Вначале необходимо составить макет таблицы, внося туда результаты построения интервального ряда (занятие 1) и произвеcсти необходимые расчеты таб.3.1 )
- •Условие: имеются данные интервального ряда распределения (таб. 1.3)
- •1.Интервальная оценка генеральной средней и доли
- •3. Определение вероятности появления заданной ошибки
- •1.Интервальная оценка генеральной средней
- •3. Определение вероятности появления заданной ошибки
2.2.2 Интервальный вариационный ряд распределения
Каждое значение непрерывного признака как правило имеет частоту встречаемости равную 1, поэтому построение вариационного ряда по типу дискретного ряда здесь невозможно. Для непрерывного признака строится интервальный вариационный ряд. Интервальный вариационный ряд может быть построен также и по дискретному признаку в том случае если он принимает значения в очень широком диапазоне ( например число жителей в населенном пункте может изменяться от 1-го до нескольких миллионов ). В интервальном вариационном ряду в левой колонке таблицы вместо отдельных значений записываются их интервалы, а в правой – вместо частот для отдельных значений признака записываются частоты интервалов, то есть сколько единиц имеют значения признака в пределах того или иного интервала. Следовательно, макет интервального вариационного ряда выглядит так :
Таблица 2.2.2
Интервальный вариационный ряд распределения …………
Интервалы значений признака |
Частота Частота интервала ( |
от до |
|
от до |
|
…………… |
|
Итого |
Сумма частот ( ) |
Построение интервального ряда распределения включает в себя несколько этапов.
На первом этапе определяется число интервалов ( групп ) на которое подразделяется совокупность. Наиболее часто используемыми формулами для определения числа интервалов являются две : и, гдечисло интервалов . а- общая численность совокупности. Эти формулы дают схожую оценку числа интервалов при общей численности совокупности примерно до 50 единиц. При большей совокупности обнаруживаются большие различия. Например, приN = 100, по первой формуле число интервалов равно 10, а по второй -7, при N =1000 соответственно 32 и 10. и предпочтение следует отдавать второй формуле.
Любой интервал содержит нижнюю и верхнюю границы На втором этапе следует рассчитать шаг интервала., то есть разницу между этими границами . Эта разница для всех интервалов должна быть одинаковой. Для расчета шага интервала обычно используется формула : , где- искомый шаг интервала ;- максимальное в совокупности значение признака ;- минимальное в совокупности значение признака ;число интервалов. Если при изучении ранжированного ряда обнаружится, что максимальное или минимальное ( или даже несколько значений ) сильно отличаются от остальных, то при расчете шага интервала следует использовать соответственно не максимальное, а предшествующее ему значение, не минимальное , а следующее в ранжированном ряду значение признака. В противном случае может получиться , что в одном- двух интервалах будут сосредоточены все наблюдения.
Шаг интервала обычно рассчитывают с той же точностью с какой представлены значения признака в изучаемой совокупности. Иногда шаг интервала берут с точностью на один знак меньше той , какая имеет место в исходной совокупности. Если при расчете шага интервала требуется округление до заданной точности , то округление производят всегда в большую сторону.
После определения шага интервала следует найти границы интервалов : первый интервал в качестве нижней границы имеет , в качестве верхней+; второй интервал в качестве нижней имеет верхнюю границу первого интервала ,то есть+, для получения верхней границы этого интервала надо вновь прибавить шаг интервала , то есть+,+=+ 2и так далее. Если при определении шага интервала пришлось отказаться от, то в первом интервале сразу находится верхняя граница, для чего к значению, которое использовалось при расчете шага интервала следует прибавить шаг интервала, нижняя граница первого интервала не обозначается . Сам интервал будет открыт снизу. Если при расчете шага интервала пришлось отказаться от максимального значения, для того , чтобы и это значение присутствовало в интервальном ряду, открытым сверху делают последний интервал. Определив границы интервалов, далее следует подсчитать сколько единиц попало в каждый интервал. Для этого удобнее всего воспользоваться ранжированным рядом, обозначив на нем границы интервалов. Если единица имеет значение признака на границе интервала, то она может вой- ти только в один интервал ; в какой именно решает сам исследователь – в нижний ( принцип включительно) или верхний ( принцип исключительно ). Результаты подсчетов оформляются в таблице, представленной ранее на макете. Графически интервальный вариационный ряд отображается в виде гистограммы распределения, при этом на оси абсцисс откладываются интервалы, а на оси ординат - частоты интервалов Вид такого графика следующий