Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
сводка и групп-ка.doc
Скачиваний:
1
Добавлен:
11.11.2019
Размер:
107.52 Кб
Скачать

2. Общие правила и техника построения группировок

Сводка данных, как второй этап статистического исследования, включает в себя в первую очередь группировку.

Группировкой в статистике называется распределение единиц изучаемой совокупности на группы по определённым существенным для них признакам и характеристика полученных групп системой показателей.

Признак, по которому производится разбивка единиц совокупности на группы, называется группировочным признаком или основанием группировки.

В процессе группировки следует соблюдать следующие общие правила:

  • в основу группировки должны быть положены только существенные признаки;

  • качественная однородность единиц, включаемых в группу;

  • группы по величине группировочного признака должны быть существенно различны;

  • достаточно большая численность единиц в группах (не менее пяти), что необходимо для получения типичных, надёжных статистических характеристик.

Техника построения статистических группировок предполагает прохождение ряда этапов.

I этап– выбор группировочного признака. Он должен основываться на анализе качественной природы изучаемого явления и учитывать задачи исследования. От правильного выбора группировочного признака зависят выводы, которые получают в результате статистического исследования.

II этап–решение вопроса о количестве групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от:

а) задач исследования;

б) вида признака, положенного в основание группировки;

в) численности совокупности;

г) степени вариации группировочного признака.

а) Например, при группировке населения по возрасту с целью определения трудовых ресурсов выделяются 3 группы: моложе трудоспособного возраста, трудоспособного возраста и старше трудоспособного возраста; а с целью анализа продолжительности жизни строится более детальная группировка и выделяются 5-ти годичные группы ( их 15: 0–4; 5–9; 10-14; 15-19; 20-24 ……70 и более.)

б) При построении группировки по качественному (атрибутивному) признаку (форма собственности, тип почвы, квалификация рабочего) число групп. Как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака.

Например, при группировке населения по полу можно образовать только две группы: мужчины и женщины.

При необходимости близкие по характеристикам и малочисленные группы объединяют в более крупные, типические.

При использовании в качестве группировочного дискретного количественного признака число выделенных групп соответствует количеству реально существующих вариантов значений этого признака, если их число не очень велико. Например, распределение рабочих по тарифным разрядам, студентов по баллу успеваемости, семей по числу их членов и т. п.

При группировке по дискретному признаку, имеющему очень большое число вариантов значений (например, численность рабочих, стаж их работы, возраст населения) и по непрерывному количественному признаку весь диапазон изменения признака разбивается на интервалы. Количество интервалов определяется с учётом факторов в) и г).

в) При небольшом объёме совокупности не следует образовывать большое число групп, так как группы будут малочисленными, а показатели, рассчитанные в них- непредставительными, нетипичными, статистически ненадёжными.

При большом числе единиц изучаемой совокупности для расчёта оптимального числа групп часто применяют формулу американского статистика Стерджесса:

п= 1+3,322 lg N = 1+1,44 lnN, где

п– число групп;

N– численность совокупности.

г) Чем больше колеблемость (вариация) группировочного признака, тем больше следует образовывать групп. (Степень колеблемости признака измеряется показателями вариации, которые будут рассмотрены в соответствующей теме). При этом следует учитывать, что число типических групп в любой совокупности не может превышать . Если некоторые группы окажутся малочисленными и не отличающимися качественно друг от друга, то их объединяют в более крупные, типические. Чтобы такое объединение не было субъективным и произвольным, по группам рассчитывают ряд существенных для изучаемого явления статистических показателей, изучают их связь с группировочным признаком и между собой и на этой основе производят укрупнение.

III этап– определение интервалов группировки.

Интервал– это значения варьирующего признака, лежащие в определённых границах. Каждый интервал имеет свою величину, нижнюю и верхнюю границы или одну из них.

Нижней границей интервала называется наименьшее значение признака в нём, а верхней границей– наибольшее значение признака в интервале.

Величина (ширина, размер, шаг) интервала представляет собой разность между его верхней и нижней границами.

Интервалы, у которых указана только одна граница, называются открытыми, а интервалы, имеющие две границы,– закрытыми. Величина открытого интервала принимается раной размеру смежного с ним интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

При плавном, постепенном изменении признака (то есть, если вариация признака проявляется в узких пределах) строят группировку с равными интервалами.

Величина равного интервала определяется по формуле:

i = , где

– соответственно наибольшее и наименьшее значение признака в совокупности;

n – число групп.

При наличии в совокупности аномальных наблюдений (единиц совокупности с резко выделяющими значениями группировочного признака) их либо исключают из исследования, либо относят к высшим или низшим группам.

Нижнюю границу первой группы принимают равной , а её верхняя граница определяется как . Этому же значению равна нижняя граница второй интервальной группы. Её верхняя граница определяется путём прибавления и т.д.

В каждый интервал включают единицы наблюдения, значения группировочного признака в которых больше или равны нижней границе или меньше или равны верхней границе.

Если имеет место совпадение верхних границ предшествующих интервалов и нижних границ следующих за ними интервалов, то должны даваться пояснения, в какой интервал относить единицы совокупности, числовые значения признака у которых совпадают с одной из этих границ. Для пояснения в первой строке в графе, в которой приводятся интервалы, ставится знак (-) или (+), что соответствует принципу «исключительно» или «включительно». Принцип «исключительно» означает, что значение признака, совпадающее с верхней границей интервала, в этот интервал не включается, а попадает в следующий интервал. Принцип «включительно» означает, что значение признака, совпадающее с верхней границей интервала, включается в этот интервал. Применяется тот принцип, который обеспечивает наиболее равномерное распределение единиц совокупности по группам.

Неравные интервалы применяются, когда вариация группировочного признака значительна.

Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

;

в геометрической прогрессии:

, где

–константа–число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах;

– константа–положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих–меньше 1.

Например, таблица 1

Группа

Прогрессивно возрастающий интервал

в арифметической прогрессии ( )

в геометрической прогрессии ( )

I

500-800 (300)

500-800 (300)

II

800-1300 (300+200)

800–1400 (300*2)

III

1300-2000 (500+200)

1400–2600 (600*2)

IY

2000-2900 (700+200)

2600–5000 (1200*2)

Y

2900-4000 (900+200)

Группировка с произвольными интервалами строится с помощью коэффициента вариации. Вначале единицы совокупности располагаются в порядке возрастания или убывания группировочного признака. В полученном ранжированном ряд первые значения признака объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из исходной совокупности. Оставшаяся часть единиц принимается за новую совокупность, для которой повторяется алгоритм образования новой группы. Итак до тех пор, пока все единицы совокупности не будут объединены в группы.

Специализированными называются интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому признаку для явлений, находящихся в различных условиях. Например, следует выделить три типа акционерных обществ: с высокими, средними и низкими дивидендами, в трёх отраслях промышленности: производство игрушек, производство животного масла и производство тканей. Для разных отраслей показатель выплаты дивидендов для отнесения к тому или другому типу будет разным (см. таблицу 2):

Отрасль промышленности

Показатель выплаты дивидендов, %

Тип компании

Число компаний

Производство игрушек

Производство животного масла

Производство тканей

до 30

30-50

50 и более

до 20

20-40

40 и более

до 10

10-30

30 и более

Н

С

В

Н

С

В

Н

С

В

-

1

4

1

2

2

4

1

Аналогично при выделении в разных отраслях экономики типов предприятий: малые и крупные, по признаку численность работников. В промышленности и строительстве предприятия со среднесписочной численностью работников 75–100 человек относятся к группе малых предприятий, а в розничной торговле– к крупным. Поэтому, строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей экономики.

Изменение границ интервалов группировочного признака при выделении одних и тех же типов в разных условиях называется специализацией интервалов группировочного признака.

Неравные интервалы получают также при построении частотных группировок. В этом случае устанавливается удельный вес числа единиц совокупности, входящих в каждую группу (например, I группа–30%, II группа–40%, III группа–30%).

При изучении ряда явлений, имеющих очень сильную степень вариации, (например, доходов населения, размеров активов и собственного капитала банков и промышленных компаний) принято выделять группы с фиксированной долей единиц, например, децильные (в каждой группе содержится 10% единиц совокупности) или квинтильные (20 –процентные). Такие группировки называются равночастотными. Границы интервалов в них будут соответствовать фактическим значениям признака в каждой группе.

IY этап– по полученным интервальным группам на основании итоговых значений разработочных таблиц для сводки данных в зависимости от цели группировки рассчитываются структура совокупности, средние значения признаков и другие статистические показатели, позволяющие всесторонне оценить состояние, развитие и взаимосвязи изучаемого явления в целом.