- •Тема 1. Предмет и задачи статистики
- •Контрольные вопросы по теме 1.
- •Тема 2. Статистические наблюдения
- •Контрольные вопросы по теме 2.
- •Тема 3. Группировка и сводка данных наблюдения
- •Контрольные вопросы по теме 6.
- •Контрольные вопросы по теме 11.
- •Контрольные вопросы по теме 13.
- •Тема 14. Статистическая проверка гипотез
- •Контрольные вопросы по теме 14. Введение
- •Контрольные вопросы по теме 1.
- •1.1. Роль и значение статистики в обществе. Основные этапы развития статистической науки. Связь дисциплины «Статистика" с другими дисциплинами
- •1.2. Предмет статистики
- •1.3. Общие понятия о статистической методологии (о методе статистики)
- •1.4. Система учёта и статистики, задачи статистики
- •1.5. Организация статистики в Республике Беларусь
- •1.6. Отчетность предприятий и ее виды
- •1.7. Специальные статистические наблюдения и их виды
- •Контрольные вопросы по теме 1
- •Тема 2. Статистические наблюдения
- •Контрольные вопросы по теме 2.
- •2.1. Сущность статистического наблюдения и его задачи
- •2.2. Формы организации статистического наблюдения
- •2.3. Виды статистического наблюдения
- •2.4. Программа статического наблюдения
- •2.5. Способы учета фактов в статистических наблюдениях
- •2.6. Ошибки статистического наблюдения. Меры по обеспечению надежности статистической информации
- •2.7. Пути совершенствования статистического наблюдения
- •Контрольные вопросы по теме 2
- •Тема 3. Группировка и сводка данных наблюдения
- •3.1. Сущность классификации и группировки, их задачи
- •3.2. Виды группировок и их назначение
- •3.3. Понятие, виды и принципы выбора группировочных признаков
- •3.4. Образование групп и определение интервалов группировок. Система статистических показателей
- •3.5. Содержание и значение сводки
- •3.6. Программа статистической сводки и ее основных элементов
- •3.7. Организация и техника сводки. Территориальный и отраслевой разряды сводки статистических материалов
- •3.8. Принципы современной организации обработки статистических данных
- •Контрольные вопросы по теме 3
- •Тема 4. Анализ статических данных и проблема измерения связи
- •4.1. Сущность и основные принципы анализа статической информации
- •4.2. Содержание основных этапов анализа статических данных
- •4.3. Содержание и виды статических расчётов
- •4.4 Основные приёмы (методы) анализа статических данных
- •4.5. Задачи измерения связи в статистике. Основные виды связей между явлениями (признаками)
- •Контрольные вопросы по теме 4
- •Тема 5. Статистические таблицы
- •5.1. Общие понятия о статистических таблицах
- •5.2. Виды статистических таблиц
- •5.3. Основные правила составления и анализа статистических таблиц
- •Контрольные вопросы по теме 5
- •Тема 6. Ряды распределения
- •Контрольные вопросы по теме 6.
- •6.1. Понятие и виды статистических рядов
- •6.2. Графический метод изучения рядов распределения
- •6.3. Понятие о закономерностях статического распределения. Теоретические кривые распределения
- •6.4. Свойства основных кривых распределения
- •Контрольные вопросы по теме 6
- •Тема 7. Абсолютные и относительные величины
- •7.1. Значение и виды статистических показателей. Проблема совершенствования системы статистических показателей
- •7.2. Абсолютные статистические величины
- •7.3. Относительные величины
- •7.4. Отношения между разноимёнными показателями
- •Контрольные вопросы по теме 7
- •Тема 8. Средние величины и показатели вариации
- •8.1. Сущность и значение средних величин в статистике
- •8.2. Виды средних
- •8.3. Средняя арифметическая, ее свойства и техника исчисления
- •8.4. Средняя гармоническая
- •8.5. Структурные средние величины (мода и медиана)
- •8.6. Показатели вариации
- •8.7. Техника исчисления простых показателей вариации
- •8.8. Основные показатели вариации. Свойства дисперсии, методы ее расчета
- •8.9. Сложение дисперсий изучаемого признака
- •8.10. Упрощенные способы вычисления средней арифметической и среднего квадратического отклонения
- •8.11. Основные правила применения средних в статистике
- •Контрольные вопросы по теме 8
- •Тема 9. Ряды динамики
- •9.1. Понятия рядов динамики и их виды
- •9.2. Обеспечение сопоставимости в рядах динамики
- •9.3. Основные характеристики рядов динамики
- •9.4. Средние показатели в рядах динамики
- •9.5. Изучение основной тенденции развития (тренда)
- •9.6. Выявление и изучение сезонных колебаний
- •9.7. Совместный анализ нескольких рядов динамики
- •Контрольные вопросы по теме 9
- •Тема 10. Индексы
- •10.1 Общее понятие об индексах. Классификация индексов
- •Индексы классифицируются по ряду признаков:
- •10.2. Индивидуальные индексы
- •10.3. Агрегатная форма общего индекса
- •Агрегатный индекс физического объема (реализации) товарооборота.
- •10.4. Преобразование агрегатного индекса в индексы средних
- •10.5. Индексы переменного и фиксированного состава
- •10.6. Другие виды индексов
- •10.7. Система взаимосвязанных индексов
- •Контрольные вопросы по теме 10
- •Тема 11. Графические изображения в статистике
- •Контрольные вопросы по теме 11.
- •11.1. Понятие о статических графиках. Основные элементы графика
- •11.2. Виды статистических графиков. Графики сравнения
- •11.3. Наглядное изображение структуры и структурных сдвигов
- •11.4. Контроль выполнения плана с помощью графиков
- •Контрольные вопросы по теме 11
- •Тема 12. Выборочный метод в статистических исследованиях
- •12.1. Выборочное статистическое наблюдение и его виды
- •12.2. Ошибка выборки
- •12.3. Обоснование численности выборки
- •А) для доли альтернативного признака
- •12.4. Способы распространения характеристик выборки на генеральную совокупность
- •12.5.Способы отбора единиц из генеральной совокупности
- •12.6. Малая выборка
- •Контрольные вопросы по теме 12
- •Тема 13. Корреляционная связь и ее статистическое изучение
- •13.1. Предпосылки изучения корреляционной связи
- •13.2. Статистические методы выявления корреляционной связи
- •13.3. Статистическое измерение тесноты корреляционной связи. Показатели меры тесноты корреляционной связи
- •13.4. Корреляция рангов
- •Примеры на ранговые корреляции
- •13.5 Множественная и частная корреляция
- •13.6. Статистические исследования формы корреляционной связи. Линия регрессии и уравнение регрессии
- •13.7. Статистическое исследование зависимости между качественными признаками
- •13.8. Изучение корреляционной зависимости между рядами динамики
- •Контрольные вопросы по теме 13
- •Тема 14. Статистическая проверка гипотез
- •Контрольные вопросы по теме 14.
- •14.1. Сущность и задачи статистической проверки гипотез
- •14.2. Критерий как инструмент проверки статистической гипотезы. Выбор типа критической области
- •14.3. Проверка гипотезы о принадлежности выделяющих единиц исследуемой генеральной совокупности
- •14.4. Понятие о критерии согласия (проверка гипотезы о соответствии эмпирического распределения нормальному)
- •14.5. Проверка гипотезы о величине средней арифметической и доли
- •14.6. Понятие о критерии для измерения связи
- •Контрольные вопросы по теме 14
- •Литература
- •220013, Минск, п. Бровки, 6
8.5. Структурные средние величины (мода и медиана)
Средние, о которых шла речь в предыдущих параграфах данной темы, являются обобщающими статистическими характеристиками изучаемого массового явления (совокупности) по тому или иному варьирующему признаку и одновременно своего рода абстракцией. Они отражают то общее, что присуще всем единицам совокупности. При этом может случиться, что величина средней не имеет точного равенства ни с одним из конкретных встречающихся в совокупности вариантов (значений единиц совокупности по признаку). Например, изучается распределение семей по количеству членов семьи:
Число членов семьи |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
∑ |
Число семей |
15 |
27 |
33 |
16 |
6 |
2 |
1 |
100 |
Среднее число членов семьи равно 3,81. Дробного числа членов семьи не может быть. Средняя показывает некоторое центральное значение, около которого группируются реально существующие варианты.
Поэтому наравне со средними в качестве общих статистических характеристик изучаемого признака могут быть использованы величины конкретных вариантов, занимающих в ранжированном (построенном в прядке возрастания или убывания) ряду индивидуальных значений признака определенное положение.
В статистических исследованиях в качестве вспомогательных описательных статистических характеристик распределения варьирующего признака широко применяются мода и медиана.
Модой в статистике называется величины признака (варианта), которая чаще всего встречается в данной совокупности. Обозначаются символом .
Медианой в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам. Обозначают медиану символом .
Определение моды и медианы в дискретном ряду, где значения признака заданы определенными числами, не представляет большой трудности.
В рассмотренном примере наиболее часто встречаются семьи, имеющие 4 члена семьи, т.е. =4 (семья имеющая 4 члена семьи).
Могут быть распределения, где все варианты встречаются одинаково часто. В этом случае моды нет. В других случаях не одна, а две варианты могут иметь наибольшие частоты. Тогда у признака будут две моды и распределение будет бимодальным.
Чтобы найти медиану в дискретном ряду, нужно сумму частот разделить пополам и к полученному результату добавить ½ или, что то же самое использовать формулу
.
Для нашего примера . Такой номер семьи делит ряд пополам. Поскольку частоты с дробным номером не бывают, то медиана находиться посредине между 50-й и 51-й частотами. Затем по накопленным частотам (частостям) определяют величину варианта (признака), обладающего таким номером.
Число членов семьи |
Число семей (частоты) |
Накопленные частоты |
2 |
15 |
15 |
3 |
27 |
42 |
4 |
33 |
75 |
5 |
16 |
91 |
6 |
6 |
97 |
7 |
2 |
99 |
8 |
1 |
100 |
Всего |
100 |
- |
В нашем примере 50-й и 51-й члены ряда имеют число семьи 4, т.е. =4 члена семьи.
Однако если единиц (частот) в совокупности достаточно много и различия между величинами рядом стоящих членов ряда небольшие, то можно считать медианой (с достаточной степенью точности) один из центральных вариантов с порядковым номером n/2. Так обычно поступают, определяя медиану при четном числе членов ряда.
Рассмотрим, как определяется мода и медиана для интервального ряда.
Прежде закрывают открытые интервалы (первый и последний) и определяют интервалы, в которых находятся мода и медиана. Их называют соответственно модальным и медианным интервалом.
Модальный интервал – интервал с наибольшей частотой. В приведенном ниже примере, модальным является интервал 170-175 см.
Для расчета определенного значения модальной величины признака, заключенного в этом интервале, применяют формулу
,
где - минимальная граница модального интервала (в нашем примере 170);
- величина модального интервала (в примере 5);
- частота интервала, предшествующего модальному (в нашем примере 100);
- частота модального интервала (в примере 130);
- частота интервала, следующего за модальным (в нашем примере 114).
Пример 2. Распределение студентов по росту.
Рост, см. |
Число студентов |
Накопленные частоты |
0-155 |
4 |
4 |
155-160 |
10 |
14 |
160-165 |
61 |
75 |
165-170 |
100 |
175 |
170-175 |
130 |
305 |
175-180 |
112 |
419 |
180-185 |
62 |
481 |
185-190 |
11 |
492 |
190 и выше |
8 |
500 |
Всего |
500 |
- |
В нашем примере:
.
Смысл этой формулы заключается в следующем: величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов.
Медианный интервал (содержащий частоту, который делит ряд пополам) определяется по накопленным частотам. Это будет интервал, накопленная частота которой равна или превышает половину суммы частот.
В нашем примере . Отсюда медианным интервалом будет интервал со значением роста от 170 до 175 см. До этого интервала сумма накопленных частей составила 175. Следовательно, чтобы получить значение медианы, необходимо прибавить 75 [или 76 единиц] (250,5-75).
При определении значения медианы предполагают, что значение признака в границах этого медианного интервала распределяется равномерно. Следовательно, если 130 студентов (единиц), находящихся в этом интервале, распределяются равномерно в интервале 5 см, то 75,5 единицам (75 или 76 единицам) будет соответствовать следующая его величина:
Прибавив полученную величину к минимальной границе интервала, получим искомую величину медианы:
;
т.е. половина студентов имеет рост меньше 172.9 см, а вторая половина – больше.
Формула для исчисления медианы в вариационном интервальном ряду будет иметь такой вид:
,
где - нижняя граница медиального интервала;
- величина медианного интервала;
- сумма частот ряда (численность ряда);
- сумма накопленных частот в интервалах, предшествующих медианному;
- частота медианного интервала.
Строго говоря, приведенная формула моды пригодна только для рядов с равными интервалами. Формула медианы применима для любого интервального ряда.
Определим среднюю арифметическую для второго примера:
Для первого примера имеем: средняя = 3,81; мода = 4; медиана = 4 члена семьи.
Для второго примера: средняя = 172,85; мода равна 173.3 и медиана = 172.9 см.
Соотношение этих трех величин указывает направление и степень ассиметрии рядов распределения. Более подробно эти вопросы рассматриваются в дисциплине “Математическая статистика”.
Таким образом мода и медиана является важными дополнительными характеристиками к средней изучаемой совокупности. Особенно ценны эти показатели для характеристик небольших по численности совокупностей. При этом следует помнить, что мода и медиана являются описательными статистическими характеристиками, т.к. в них не погашаются индивидуальные отклонения, они всегда соответствуют определенной варианте.
В то же время можно привести немало примеров, когда мода или медиана являются более эффективной характеристикой, чем средняя.
Например, при статистических методах контроля качества продукции, при оценке качества передачи информации, надежности работы средств труда широкого применяются мода и медиана. Так, таксофон, почтовый ящик следует разместить не на середине улицы, а в точке, которая делит численность проживающих пополам. Используется медиана. Показатель «вероятность безотказной работы» оценивается модой.
Считается, что медиана по своему положению более определена, чем мода.
Выше было сказано, что средняя, мода и медиана совместно используются при анализе ряда распределения по структуре (на симметрию). Если , то данный ряд симметричный. Если , то в ряду имеются группы с очень высокими частотами и если таких групп нет. Если совокупность неоднородна и т.д.
Для характеристики структуры вариационного ряда кроме моды и медианы в статистике исчисляются и другие характеристики: квартили, децили, процентили. Они рассматриваются в дисциплине “Общая теория статистики” для студентов статистических специальностей.