- •2. Предмет, метод и задачи статистики.
- •3.Сущность сводки и группировки статистических данных.
- •4. Виды группировок.
- •5. Статистические ряды распределения.
- •6. Понятие статистических таблиц, основные требования построения.
- •7. Статистическое наблюдение: формы, виды, и способы.
- •8. Современная организация государственной статистики России.
- •9. Статистическая отчётность.
- •10. Контроль материалов наблюдения.
- •11. Понятие, методы расчёта абсолютных и относительных величин.
- •12. Виды относительных величин.
- •13. Принципы построения относительных величин. Системы статистических показателей. Общие принципы построения относительных статистических показателей
- •Понятие о системах статистических показателей
- •14. Графическое отображение статистических данных.
- •15. Понятие, сущность, значение средних величин.
- •17.Виды степенных средних.
- •Формула средней гармонической:
- •Гармоническая простая
- •Квадратическая простая
- •Квадратическая взвешенная
- •18.Структурные средние величины.
- •19.Понятие и сущность рядов динамики в статистике.
- •21.Средние показатели рядов динамики.
- •22.Понятие и методология выравнивания рядов динамики.
- •23. Анализ сезонных колебаний.
- •24. Аналитическое выравнивание.
- •Графическое представление полиномов n-порядка
- •25. Методы прогнозирования в статистике.
- •28. Нормальное распределение и его свойства.
- •Моменты
- •Бесконечная делимость
- •Максимальная энтропия
- •29.Сущность, значение и категории выборочного наблюдения.
- •30.Виды и способы отбора.
- •31.Ошибки выборочного наблюдения.
- •32. Определение объема выборки.
- •33. Понятие корреляционно-регрессионного анализа в статистике.
- •I. Множественный корреляционно-регрессионный анализ.
- •37.Понятие и основные элементы индексов.
- •2. Индивидуальные индексы
- •38.Агрегатные индексы.
- •4. Другие агрегатные индексы
- •39. Индексный анализ при изучении экономических явлений.
- •40. Средневзвешенные индексы.
- •41. Понятие вариационного ряда.
- •42. Методологические вопросы построения группировок.
- •43. Статистические таблицы, их виды и основные правила построения и оформления.
- •Групповые таблицы
- •Комбинационные таблицы
- •44. Абсолютные статистические величины, их виды, значение и единицы измерения.
- •45. Понятие о статистическом графике, его основные элементы и правила построения.
- •46. Виды статистических графиков.
- •47. Средняя гармоническая и другие виды средних.
- •48. Обусловленность выбора средней характером исходной информации.
- •49. Мода и медиана, их смысл и значение в социально-экономических исследованиях, способы вычисления.
- •50. Дисперсия альтернативного признака.
- •51. Сущность выборочного наблюдения и его теоретические основы.
- •52. Определение необходимой численности (объема) выборки.
- •53. Понятие о рядах динамики, их виды и правила построения.
- •54. Аналитические показатели динамического ряда, способы их расчета и взаимосвязь.
- •55. Средние показатели динамического ряда и методы их расчета.
- •56. Понятие тенденции ряда динамики и основные методы ее выявления (укрупнение интервалов, способ скользящей средней).
- •57. Аналитическое выравнивание уровней ряда динамики. Уравнение тренда. Понятие о интерполяции и экстраполяции.
- •58. Принципы построения многофакторных индексов.
48. Обусловленность выбора средней характером исходной информации.
Основная функция средней величины заключается в «сжатии» исходной информации. Представим, что нам интересно сравнить уровень зарплат в некоторых странах, в которых проживает по несколько миллионов человек. Зарплаты у всех разные, есть богатые, бедные, середнячки. Как правильно определить, в какой стране люди получают больше? Как получить обобщающую оценку уровня благосостояния? А ведь именно так часто ставится вопрос: где больше получают, у нас или у них? Невозможно ответить на этот вопрос, не прибегая к статистическому анализу данных. Однако, если рассчитать средние зарплаты по странам, то огромное количество исходных данных «сожмется» всего до одного показателя по каждой стране. После этого средние значения можно очень легко и наглядно сопоставить между собой. Нужно понимать, что при переходе от исходных данных к средним значениям все многообразие первоначальных данных исчезает. Мы уже не увидим зарплату каждого работника в отдельности (часть информации теряется), но зато огромный объем исходной информации, который невозможно осмыслить и переварить невооруженным мозгом, превращается в достаточно компактную и информативную характеристику всей совокупности значений. Жонглировать одним мячом легче, чем несколькими. Следить за одной птичкой легче, чем за десятью. Короче, с одним предметом легче управиться, чем со многими.
Качество такой характеристики (средней) зависит от исходных данных, но суть от этого не меняется – большой объем данных «сжимается» до одного значения. Если исходные данные в статистическом смысле качественные (однородные), то среднее значение, сохранит информативность (то есть корректно отразит закономерность) исходных данных и во много раз уменьшит их объем. Однако в реальности однородная совокупность данных встречается не часто. Дальнейшие действия зависят от целей анализа. Если нам все-таки важно быстро и просто получить обобщенную оценку зарплат по странам, то можно рассчитать средние величины, игнорируя их однородность. Тогда нужно иметь в виду, что рассчитанные средние значения не будут надежно отражать закономерный уровень зарплат, а будут только показывать общий фонд заработной платы на одного работника. Именно этот показатель чаще всего можно встретить в различных публикациях. Но мы теперь, как грамотные аналитики понимаем, что трактовать его следует не как средний (закономерный) уровень з/п, а буквально так, как он рассчитывается: фонд з/п на одного работника. Это, конечно, мелочь для обывателя, но все-таки согласимся, что между рядами чисел {8, 10, 9, 7, 8, 7, 2, 1, 2, 1, 3, 2} и {4, 5, 5, 6, 3, 5, 5, 4, 7, 5, 6, 5} есть некоторая качественная разница, хотя в обоих рядах средняя арифметическая одинаковая – 5. Для наглядности различий изобразим данные на графиках.
На левом рисунке отчетливо видно, что в первом множестве чисел данные неоднородны – часть значений существенно больше, чем среднее значение (красная линия), часть – значительно меньше; во втором множестве (правый рисунок) все значения гораздо более однородны (незначительно отличаются друг от друга и скученны около среднего значения – красной линии). Этот пример с числами аналогичен примеру в предыдущей статье о бедных и богатых.
Если мы хотим добиться статистически качественных средних, то исходную неоднородную совокупность следует разделить на однородные группы и уже по сгруппированным данным рассчитывать средние значения. Сколько получится групп, столько и средних значений. Это если делать по науке. На практике мало кто знает, что такое однородность и продолжает считать «среднюю температуру по больнице». С другой стороны, зачастую однородность вовсе и не требуется, потому что аналитику обычно интересен анализ ситуации в динамике. А в динамике неоднородность нивелируются примерно так же, как сокращаются дроби (не будем вдаваться в увлекательную алгебру 6-го класса). В общем, однородность данных – это важное требование, но не всегда необходимое. Однако вернемся к правильной и строгой статистике.
Очевидно, чем на большее количество групп разделить исходные данные, тем более однородными они будут внутри каждой группы. Однако при этом возрастает количество самих средних значений, а это в свою очередь затрудняет проведение и осмысление статистическо анализа. По этой причине аналитик должен стараться добиться оптимального соотношения между количеством групп и их качеством (однородностью). Также следует обратить внимание на количество значений внутри групп. Часто бывает, что вся совокупность делится так, что большинство значений попадает только в одну-две группы, а остальные значения настолько отличаются от основной массы, что хоть отдельные группы делай для них. Понятно дело, что анализировать данные из одного или двух наблюдений нет смысла. Такие значения называют аномальными, и во многих случаях их следует вообще исключить из расчетов (но, все-таки не забывая об их существовании).
Таким образом, есть два полярных типа информации: либо максимально точный (если оперировать каждым исходным значением отдельно), либо максимально компактный (когда вся информация заменяется одной характеристикой, например средним значением). Промежуточные варианты определяются группировкой данных. Чем больше групп, тем более однородны в них данные, но тем больше и средних значений. Данное положение вызывает проблему выбора между точностью и компактностью. Если данные анализируется в динамике, то неоднородностью можно пренебречь, так как она мало влияет на динамику показателя. Но если мы сравниваем средние величины с другими средними величинами (с другими объектами в пространстве, а не в динамике), то на качество показателей все же следует обращать внимание. Для неоднородных данных следует провести группировку и/или корректно трактовать результаты расчетов. Самое главное для аналитика не отрываться от земли и за каждым расчетом чувствовать связь с реальностью.