Тема 3. Сводка и группировка данных статистического наблюдения
3.1. Сводка статистических данных 1
3.2. Понятие и виды группировок. Образование групп и интервалов группировки 2
3.3. Статистические ряды распределения 4
3.4. Статистические таблицы 8
3.1. Сводка статистических данных
Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведении разрозненных данных воедино. Научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных систематизацию, группировку материалов, составление таблиц, получение итогов и производных показателей (средних, относительных величин), называется в статистике сводкой. Сводка представляет второй этап статистического исследования, цель которого – получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности.
Статистическая сводка осуществляется по программе, которая должна разрабатываться еще до сбора статистических данных, практически одновременно с составлением плана и программы статистического наблюдения. Программа сводки включает определение:
- групп и подгрупп;
- системы показателей;
- видов таблиц.
Все эти вопросы, разумеется, следует решать не механически, а с учетом цели исследования и особенностей изучаемой совокупности. Выделение тех или иных групп должно быть обоснованным, неформальным. Кроме итоговых и групповых показателей сводка дает основу для последующего анализа и выявления различного рода закономерностей.
По технике или способу выполнения сводка может быть ручной либо механизированной. Ручная сводка применяется в основном для небольших массивов данных и начинается с шифровки статистических формуляров (карточек). Затем формуляры определенным образом группируются и подсчитываются их число и другие показатели. При механизированной сводке и больших объемах совокупности исходные данные могут сразу заноситься на машиночитаемые носители информации и полностью обрабатываться на ЭВМ.
3.2. Понятие и виды группировок. Образование групп и интервалов группировки
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.
Признаки единиц совокупности, положенные в основание группировки, называются группировочными признаками или основанием группировки.
При проведении группировки следует руководствоваться следующими правилами:
Уяснение сущности изучаемого явления.
Выбор в качестве группировочных наиболее существенных (отвечающих сущности изучаемого явления) признаков.
Учет конкретных особенностей изучаемого явления.
При характеристике сложных общественных явлений желателен выбор нескольких признаков в качестве группировочных.
Группировки классифицируют по нескольким признакам.
1. По числу признаков. Если группировка проведена по одному признаку, ее называют простой, если по двум и более признакам – комбинационной.
2. По характеру и содержанию решаемых задач. В рамках классификации по этому признаку различают типологические, структурные и аналитические группировки.
Типологическая группировка обеспечивает разделение сложной совокупности на качественно различные типы явлений (например, группировка предприятий по форме собственности или населения по общественным группам и т.п.).
Структурная группировка показывает строение качественно однородных совокупностей (например, состав населения по возрасту, полу и т.п., рабочих по профессиям, уровню квалификации и т.п.,).
Аналитическая группировка выявляет наличие или отсутствие взаимосвязей между признаками общественных явлений: факторным (группировочным) и результативным (изучаемым). Например, при изучении влияния стажа работы на выполнение норм выработки рабочими-сдельщиками, стаж работы – это факторный признак (основание группировки), а % выполнения норм выработки – результативный признак.
3. По характеру исходного материала. Если для группировки используют данные статистического наблюдения в необработанном виде, то такая группировка называется первичной. Если группировка проводится на основе ранее составленной группировки, она называется вторичной.
После выбора группировочного признака выделяют конкретные группы, которые должны быть качественно однородными и достаточно крупными по числу единиц (не менее 4-х).
Важное значение имеет правильное определение числа групп. При группировке по атрибутивным (качественным) признакам число групп определяется количеством соответствующих наименований.
При группировке по количественным дискретным признакам с небольшим количеством значений (число бригад в цехе, число оценок при аттестации, число детей в семье и т.д.) число групп определяется в зависимости от числа значений признаков.
Более сложным является определение числа групп по количественным, непрерывно меняющимся (урожайность сельскохозяйственных культур, себестоимость 1 ц продукции, рентабельность продукции, цена товара и т.д.), или дискретным, изменяющим свои значения в широких пределах (численность населения, количество предприятий в регионе и т.д.) признакам. В этих случаях образуют интервалы.
Для нахождения числа групп используется формула
,
где N – количество элементов совокупности.
Под интервалом понимается разность между максимальным (верхняя граница интервала) и минимальным (нижняя граница интервала) значением признака в группе. По величине интервалы делят на равные и неравные.
Равными называют интервалы, у которых разность между верхней и нижней границами одинакова для всех групп. Их применяют при сравнительно равномерном изменении признака в ограниченных пределах.
Например, группировка хозяйств по среднему удою молока от одной коровы (ц):
I группа хозяйств – до 20
II группа хозяйств – 20 – 30
III группа хозяйств – 30 – 40
IV группа хозяйств – свыше 40
В данном случае величина интервала равна 10ц.
Величину равных интервалов определяют по формуле:
где i – величина интервала,
xmax – максимальное значение признака,
xmin – минимальное значение признака,
n – число групп.
Неравными называются интервалы, у которых разность между верхней и нижней границами неодинакова: она может нарастать или убывать от группы к группе. Применяются неравные интервалы в тех случаях, когда изучаемый признак изменяется в широких пределах.
Например, группировка предприятий региона по численности работников (чел):
I группа хозяйств – до 30
II группа хозяйств – 30 – 60
III группа хозяйств – 60 –100
IV группа хозяйств – 100 – 200
V группа хозяйств – 200 – 400
VI группа хозяйств – 400 – 700
VII группа хозяйств – 700 – 1000
и т.д.
Здесь величина интервала изменяется по нарастающей, так как диапазон изменения численности работников имеет тем меньшее значение для характеристики размера хозяйства, чем о большей численности идет речь.
Различают интервалы открытые и закрытые. Закрытыми называют интервалы, имеющие как верхнюю, так и нижнюю границы, у открытых интервалов одна из границ отсутствует.