Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
154
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

5.4. Основные вопросы организации и построения сводки...

131

Альтернативой комбинационным группировкам являются мно гомерные группировки, или многомерные классификации.

Метод многомерных группировок позволяет преодолеть недостат ки комбинационной группировки. Построение многомерных груп пировок рассмотрено в п. 5.5.

5.4. Основные вопросы организации и построения сводки и группировки статистического материала

Получение сводных статистических данных представляет собой сложный многоступенчатый процесс, от уровня научной органи зации которого решающим образом зависит качество полученной информации.

Качество обработки большого массива статистического матери ала было повышено возможностью электронной обработки данных, позволяющей автоматически осуществлять сводку и группировку на разных уровнях обобщения и в нужных разрезах (по территори ям, ведомственной принадлежности, формам собственности, сек торам экономики, отраслям и т.д.).

Переход на новую вычислительную технику и современные тех нологии сводной обработки информации вызвал изменение прин ципиальных подходов к процессу сводки и группировки статисти ческих данных. Прежде чем приступить к получению обобщающих статистических характеристик исследуемых социально экономи ческих явлений и процессов в автоматизированном режиме, про граммой машинной обработки предусмотрен комплекс работ по контролю и достоверности первичного статистического материала на стадии подготовки к электронной обработке. Контроль процес са сбора данных осуществляется путем проведения мониторинга с помощью программного блока для отслеживания доли полученных ответов от респондентов.

Все вычислительные и логические операции, реализуемые в ав томатизированном режиме, объединяются в один этап обработки данных, и выделение сводки и группировки как особого этапа ста тистической работы является неоправданным. Соответствующие им операции образуют внутреннее подразделение единого этапа обра ботки, в рамках которого они состыкуются с аналитическими рас четами. Полученные сводные данные и статистические группиров

132 Глава 5. Сводка и группировка статистических материалов

ки подвергаются анализу, который непосредственно проводит эко номист статистик.

Использование современной техники позволяет совершенствовать процесс получения сводной информации. Например, для получения обобщенных демографических характеристик для государственного управления, разработки прогнозов и программ социально экономи ческого развития Российской Федерации при проведении Всероссий ской переписи населения 2002 г. были изменены схема и порядок вво да и обработки первичных данных с использованием технических и программных средств.

Закодированные графическими метками и цифрами ответы оп рашиваемых вводились путем сканирования машиночитаемых пе реписных документов для обработки и получения итоговых таблиц. Данный метод был в дальшейшем использован при проведении Всероссийской сельскохозяйственной переписи 2006 г.

При проведении статистической сводки логический и арифме тический контроль и статистическое редактирование являются дву мя видами контроля исходных данных, влияющих на сводные ито ги. Статистическое редактирование связано с идентификацией значений данных.

Эффективное применение электронной техники позволяет на основе полученной сводки проводить комплексный анализ с при менением математических методов и моделей, а использование интернет технологий дает возможность проводить сбор данных от предприятий и обеспечивает доступ к статистическим данным.

Разработка научно методологических вопросов по научному обобщению собранных данных определяет ряд требований к госу дарственной статистике, в число которых входят требования по сбо ру и обработке статистического материала. Этот вопрос — один из центральных и является важнейшим условием правильного пост роения статистики.

Качество сводной информации обеспечивается правильным выбором системы показателей, характеризующих наблюдаемый объект и выбор группировочного признака, на основании которо го выявляют закономерности наблюдаемых общественных явлений и процессов.

Практическая работа по организации государственной статис тики в части состава показателей привела к необходимости разра ботки методологических основ систематизации показателей и со

5.4. Основные вопросы организации и построения сводки...

133

здания на единой системной основе методологии упорядоченного множества взаимосвязанных и взаимосогласованных показателей, используемых в статистической практике.

Результатом проделанной работы стало создание каталога ста тистических показателей (КСП). Для электронной обработки дан ных с 1 января 2003 г. введен в действие электронный каталог ста тистических показателей (ЭКСП). Все статистические показатели, используемые органами государственной статистики, подлежат обязательной регистрации в ЭКСП. Этот каталог построен на меж отраслевой основе как сквозная система, в которой каждый пока затель имеет свой совокупный код идентификации.

Каталог включает первичные показатели форм федерального статистического наблюдения; расчетные, сводные и балансовые показатели, формируемые программными средствами электронной обработки данных на основе показателей, имеющихся в базах дан ных, официальных публикациях.

Рассмотрим методологические основы построения сложной сводки. Для получения качественной группировки статистическо го материала остановимся подробнее на принципах выбора груп пировочного признака.

Группировочным называется признак, по которому осуществля ется разбиение единиц совокупности на отдельные группы. Его так же называются основанием группировки.

Выбор основания группировки является определяющим этапом построения сложной сводки. Из множества признаков, характери зующих изучаемый объект, следует выбрать такой признак, кото рый был бы адекватен цели исследования и характеру исходного статистического материала.

При выборе группировочного признака нужно учитывать конк ретные условия развития явлений. Так, для характеристики отдель ных отраслей прежде можно было выделить типы предприятий в зависимости от объема выпущенной продукции: крупные, сред ние, мелкие, а в зависимости от величины прибыли: рентабельные, нерентабельные. В настоящее время появилось новое понятие «ма лое предприятие», требующее особого подхода к выбору группиро вочных признаков, а типы предприятий группируются по ранее отсутствующим видам: форме собственности, организационно пра вовой форме и др.

134 Глава 5. Сводка и группировка статистических материалов

От выбора признака группировки зависит правильность отне сения единиц совокупности к той или иной группе. Если признак выбран неправильно, то разграничения групп не получится. Напри мер, разделение предприятий на крупные, средние, малые может быть произведено по различным признакам: числу работников, объему продукции, мощности оборудования и т.д. Чтобы правиль но выбрать один из этих признаков, следует учесть особенности каждой отрасли и факторы, от которых в наибольшей степени за висят размеры предприятий.

Так, в мировой практике для отнесения предприятий к малым существует до 50 критериев, однако в нашей практике основным является численность работников. Согласно новому Федерально му закону от 24 июля 2007 г. № 209 ФЗ «О развитии малого и сред него предпринимательства» для малого предприятия ценз уста навливает численность не более 100 человек. Для предприятий, численность которых не превышает 15 человек, введено новое по нятие «микропредприятие».

Основанием группировки может служить как атрибутивный (ка чественный), так и количественный признак.

Атрибутивные признаки выражают свойства явления в виде их наименования. Количество групп определяется перечнем наиме нований. Так, при группировке населения по форме занятости мож но выделить две группы: занятые в экономике и безработные, а при группировке по национальности число групп равно количеству на циональностей, зафиксированных на территории на момент обсле дования.

В случае большого дробления изучаемого явления по атрибутив ному признаку целесообразно объединять ряд их наименований. Например, для сводной характеристики выпуска промышленной продукции по отдельным подотраслям группировку строят в целом по отдельным отраслям, включающим иногда несколько подотрас лей (отрасль «машиностроение» включает подотрасли: автомоби лестроение, станкостроение, приборостроение и т.д.).

Для многих атрибутивных признаков разрабатываются устойчи вые номенклатуры групп и подгрупп, называемые классификаци ями.

При построении группировки по количественному признаку необходимо решить вопрос о числе групп, близких по значению варьирующего признака исследуемых единиц совокупности.

5.4. Основные вопросы организации и построения сводки...

135

Число групп зависит от цели и задач исследования и вида пока зателя, положенного в основание группировки, объема совокупно сти и степени вариации группировочного признака.

Учет объема изучаемой совокупности предполагает установле ние такого количества групп, чтобы достаточно четко и определен но выявился характер распределения и особенности изучаемого явления. При небольшом объеме совокупности не следует образо вывать большого количества групп, так как группы будут включать недостаточное число единиц и показатели, рассчитанные для та ких групп, не будут типичными и не позволят получить адекват ную характеристику исследуемого явления.

Группировка по количественному признаку зависит в первую очередь от степени колеблемости группировочного признака: чем больше колеблемость признака, тем больше можно образовать групп.

Чем больше образовано групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании объектов наблюдения.

Определение числа групп можно осуществить с помощью фор мулы Стерджесса:

n =1 + 3,322lgN,

где п — число групп;

N — число единиц совокупности.

Применение формулы дает хорошие результаты, в случае если совокупность состоит из большого числа единиц. При определе нии числа групп данным методом существует большая вероятность получения «пустых», или малочисленных, групп. Пустыми назы ваются группы, которые не содержат ни одной единицы совокуп ности.

После того как определено число групп, следует установить ин тервалы группировки.

Интервал группировки определяет границы значений варьирую щего признака, лежащих в пределах определенной группы.

Нижней границей интервала называется наименьшее значение признака в интервале, верхней — наибольшее.

Нижняя граница первого интервала, как правило, принимается равной наименьшему значению признака, верхняя граница пос

136 Глава 5. Сводка и группировка статистических материалов

леднего интервала не может быть меньше наибольшего значения признака единиц наблюдения.

Шириной интервала называется разность между верхней и ниж ней границами.

Интервалы группировки в зависимости от их ширины бывают равные и неравные. Последние делятся на прогрессивно возраста ющие, прогрессивно убывающие, произвольные и специализиро ванные.

Если вариация признака проявляется в сравнительно узких гра ницах и распределение носит равномерный характер, то строят груп пировку с равными интервалами. Ширина равного интервала (h) оп ределяется по формуле

h = R = xmax xmin ,

nn

где хmax, xmin — соответственно максимальное и минимальное значения признака в совокупности;

n — число групп.

Полученную по формуле величину округляют, и она будет яв ляться шагом интервала.

Существуют следующие правила определения шага интервала. Если ширина интервала, рассчитанная по формуле, представляет собой величину, которая имеет один знак до запятой (например: 0,76; 1,491; 5,63), то в этом случае полученные значения целесооб разно округлить до десятых и использовать их в качестве шага ин тервала. В приведенном выше примере это будут соответственно значения: 0,8; 1,5; 5,6.

Если рассчитанная величина интервала имеет две значащие циф ры до запятой и несколько после запятой (например, 26,789), то это значение целесообразно округлить до целого числа (до 27).

В случае когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту вели чину следует округлить до ближайшего числа, кратного 100 или 50 (табл. 5.12).

Если размах вариации признака в совокупности велик и значе ния признака варьируют неравномерно, то надо использовать груп пировку с неравными интервалами. Неравные интервалы могут быть получены несколькими способами.

5.4. Основные вопросы организации и построения сводки...

137

 

 

 

Таблица 5.12

Группировка коммерческих банков по величине активов

 

 

 

Группы банков по величине

2006 г.

активов, млн руб.

Количество банков

Удельный вес, %

 

 

 

 

От 100

до 600

484

37,26

От 600

до 1 100

398

30,64

От 1 100 до 1 600

308

23,72

От 1 600 до 2 100

109

8,38

 

 

 

 

Итого

 

1 299

100,00

 

 

 

 

В случае если построенная группировка с равными интервала ми содержит группы, не отражающие определенные типы изучае мого явления или процесса либо не содержащие ни одной едини цы совокупности, то возникает необходимость объединения малочисленных, или «пустых», интервалов с последующими.

Другим способом построения неравных интервалов является применение прогрессивно возрастающих и прогрессивно убываю щих интервалов, в основе построения которых лежит принцип арифметической или геометрической прогрессии. Величина интер валов, изменяющихся в арифметической прогрессии, определяет ся по формуле

hi + 1 = hi + a,

где а — константа (для прогрессивно возрастающих интервалов имеет знак «+» и знак «–» для прогрессивно убывающих);

hi + 1 — величина (i +1) интервала,

а величина интервалов, изменяющихся в геометрической прогрес сии, рассчитывается по формуле

hi + 1 = hi q,

где q — константа (q > 1 — для прогрессивно возрастающих и q < 1 — для прогрессивно убывающих интервалов).

Применение неравных интервалов обусловлено спецификой и особенностями изучаемого социально экономического явления или процесса, когда в первых группах небольшая разница в пока зателях имеет большое значение, а в последних группах эта разни ца существенного значения не имеет (табл. 5.13).

При построении группировки коммерческих банков по числен ности работающих, которая варьирует от 50 до 1550 человек, неце

138 Глава 5. Сводка и группировка статистических материалов

Таблица 5.13

Группировка коммерческих банков по численности работников

Группы банков по численности

2006 г.

работников, человек

Количество банков

Удельный вес, %

 

 

 

50—200

473

36,41

200—500

198

15,24

500—950

291

22,40

950—1 550

337

25,95

 

 

 

Итого

1 299

100,00

 

 

 

лесообразно рассматривать равные интервалы, так как при этом учитываются как малые, так и крупнейшие банки. Поэтому следует образовывать неравные интервалы: 50—200, 200—500, 500—950, т.е. величина каждого последующего интервала больше предыдущего на 200 человек и увеличивается в арифметической прогрессии.

Решение вопроса о выборе равных или неравных интервалов зависит от числа единиц совокупности, попавших в каждую выде ленную группу, т.е. от степени заполнения интервалов.

Интервалы группировок могут быть закрытыми и открытыми. Закрытыми называются интервалы, в которых указаны верхняя и нижняя границы.

Открытыми называются интервалы, в которых указана только одна граница: верхняя — у первого, нижняя — у последнего (табл. 5.14).

 

 

Таблица 5.14

Группировка коммерческих банков по величине

зарегистрированного уставного капитала

 

 

 

Группы банков по уставному

2006 г.

капиталу, млн руб.

Количество банков

Удельный вес, %

 

 

 

До 30

73

5,62

30—150

801

61,66

150—300

191

14,70

300 и выше

234

18,02

 

 

 

Итого

1 299

100,00

 

 

 

При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по разному

5.4. Основные вопросы организации и построения сводки...

139

в зависимости от того, является ли этот признак непрерывным или дискретным.

Если основанием группировки служит непрерывный признак (например, группы лизинговых компаний по величине прибыли, млн руб.: 15—25, 25—30, 30—35, 35—40), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае величина прибыли 25 млн руб. состав ляет верхнюю границу первого интервала и нижнюю границу вто рого, 30 млн руб. — соответственно второго и третьего и т.д., т.е. верхняя граница i го интервала равна нижней границе (i+1) интер вала.

При таком обозначении границ может возникнуть вопрос, в ка кую группу включать единицы совокупности, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти лизинговая компания с прибы лью 30 млн руб. Если верхняя граница формируется по принципу «исключительно», то компания должна быть отнесена к третьей группе, в противном случае — ко второй. Для того чтобы правиль но отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ис пользовать открытые интервалы (в нашем примере группы лизин говых компаний по прибыли преобразуются в следующие: до 25, 25—30, 30—35, 35 и более). В данном случае — вопрос отнесения отдельных единиц совокупности, значения которых являются гра ничными, к той или иной группе решается на основе анализа последнего открытого интервала.

Возможны два случая обозначения последнего открытого интер вала: 1) 35 млн руб. и более; 2) более 35 млн руб. В первом случае лизинговые компании с величиной прибыли 30 млн руб. попадут в третью группу; во втором случае — во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i го интервала равна верхней границе (i – 1) ин тервала, увеличенной на 1 единицу. Например, группы нотариаль ных контор по числу занятого персонала, человек: 10—15, 16—20, 21—30.

При определении границ интервалов статистических группиро вок иногда исходят из того, что изменение количественного при знака приводит к появлению нового качества. В этом случае грани ца интервала устанавливается там, где осуществляется переход от

140 Глава 5. Сводка и группировка статистических материалов

одного качества к другому. В группировках, имеющих целью ото бразить качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по признаку, применяются спе циализированные интервалы (табл. 5.15).

Таблица 5.15

Группировка личных подсобных хозяйств по размеру общей посевной площади сельскохозяйственных культур (данные переписи в Российской Федерации 2006 г.)

Хозяйства,

Число хозяйств

Посевная площадь

имеющие

 

 

сельскохозяйственных культур

посевную

всего,

% общего

всего,

% общей

площадь, га

ед.

числа хозяйств

тыс. га

посевной площади

 

 

 

 

 

До 0,06

4 263 000

28,50

111,5

4,40

0,06—0,15

5 258 175

35,20

495,3

19,70

0,16—0,25

2 326 134

15,60

455,7

18,10

0,26—0,35

1 163 782

7,80

343,1

13,60

0,36—0,45

564 699

3,80

223,8

8,90

0,46—0,55

297 742

2,00

146,5

5,80

0,56—0,65

132 192

0,90

78,9

3,10

0,66—0,75

79 450

0,50

55,4

2,20

0,76—1,00

154 732

1,00

137,5

5,50

1,01—3,00

94 554

0,60

130,6

5,20

3,01—5,00

4 990

0,00

18,8

0,70

5,01—10,00

5 279

0,00

36,6

1,50

Свыше 10,0

7 934

0,10

283,9

11,30

 

 

 

 

 

Всего

14 352 663

96,00

2 517,7

100,00

 

 

 

 

 

Не имеющие

594 863

4,00

x

x

посевной

 

 

 

 

площади

 

 

 

 

 

 

 

 

 

Итого

14 947 526

100,00

2 517,7

100,00

 

 

 

 

 

Специализированными называются интервалы, которые применя ются для выделения из совокупности одних и тех же типов по од ному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально экономических явлений на макро уровне часто применяют группировки, интервалы которых не бу дут ни прогрессивно возрастающими, ни прогрессивно убывающи ми. Такие интервалы называются произвольными и, как правило,