Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Охезина.pdf
Скачиваний:
13
Добавлен:
28.03.2015
Размер:
1.87 Mб
Скачать

Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою очередь, подразделяются по третьему и т.д. Таким образом, сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам.

В табл. 1.4 приведена сложная группировка семей России по месту проживания и числу детей.

Таблица 1.4

Группировка семей России по месту проживания и числу детей в 1989 г. (по материалам переписи населения)

Группа семей по месту проживания

В том числе подгруппа

Число семей, тыс.

 

семей по числу детей

 

 

 

 

1. Городское население

1 ребенок

9605

 

2

детей

6936

 

3

– « –

971

 

4

– « –

153

 

5

и более детей

76

 

 

 

 

Итого по группе

 

 

17741

 

 

 

2. Сельское население

1 ребенок

2328

 

2

детей

2306

 

3

– « –

757

 

4

– « –

213

 

5

и более детей

141

 

 

 

 

Итого по группе

 

 

5745

 

 

 

Итого по подгруппам

1 ребенок

11 933

 

2

детей

9242

 

3

– « –

1 728

 

4

– « –

366

 

5

и более детей

217

 

 

 

 

Всего

 

 

23486

 

 

 

 

По первому признаку образованы две группы, а по второму – пять. Группировка показывает, что большинство семей и в городе, и в деревне имеет только одного ребенка, а в общей численности семей они составляют почти 51% (11933:23 486). Число городских семей, в которых два ребенка, меньше почти в 1,4 раза, чем семей с одним ребенком. В сельской местности численность таких семей различается незначительно – всего на 1%.

Меньше всего семей с численностью детей 5 и более человек. Однако среди сельского населения они составляют 2,5%, городского – лишь 0,4%, а во всем населении – 0,9%.

8

1.3. ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК

Приемы проведения статистических группировок весьма разнообразны. Это связано с разными задачами, которые в соответствии с целью исследования ставятся перед группировками. Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки. В качестве основания группировки следует использовать существенные признаки. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно – правовая форма и т.д.).

После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака. Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.

При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка производства товаров народного потребления по экономическим районам, то вся исследуемая совокупность делится на 11 групп: именно на столько экономических районов поделена территория страны.

Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления. Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше

9

следует образовать групп. (Степень колеблемости признака измеряется показателями вариации, которые подробно рассмотрены в разделе 3).

При использовании электронно-вычислительных машин и персональных компьютеров для обработки статистических данных группировка единиц объекта проводится с помощью стандартных процедур. Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

 

 

 

 

n =1+3,322lg N,

 

(1.1)

где n – число групп; N – число единиц совокупности.

 

 

 

Получаем следующие соотношения:

 

 

 

 

 

 

 

 

 

 

 

N

 

15–24

25–44

45–89

90–179

180–359

360–719

 

 

 

 

 

 

 

 

п

 

5

6

7

8

9

10

 

 

 

 

 

 

 

 

После определения числа групп следует определить интервалы группировки.

Интервал это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:

i= R / n,

(1.2)

где R = Хmax – Xmin , т.е. размах вариации; Хmax, Xmin – максимальное и минимальное значение признака в совокупности.

Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения. Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.

10

Полученную по формуле (1.2) величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала. Если величина интервала, рассчитанная по формуле (1.2), представляет собой величину, имеющую один знак до запятой (например 0,66: 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере шагом интервала будут соответственно значения 0,7; 1.4;5,8.

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле (1.2), равна 12,785. Тогда это значение следует округлить до целого числа, т.е. до 13.

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250. Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 млн руб., а минимальное его значение – 290 млн руб. Совокупность включает 80 единиц. Согласно формуле (1.1) она должна быть разбита на 7 групп. Сначала следует найти:

R = 2040 – 290 = 1750 млн руб.

Затем определим величину интервала:

i= 1750 : 7= 250 млн руб.

После этого построим интервалы групп (табл. 1.5).

 

Варианты построения групп

Таблица 1.5

 

 

 

 

 

 

 

 

 

№ группы

I вариант

 

 

II вариант

 

 

 

 

 

до 540

 

I

от 290

до 540

 

II

540

790

 

540 – 790

 

III

790

1040

 

790–1040

 

IV

1040

1290

 

1040 – 1290

 

V

1290

1540

 

1290 – 1540

 

VI

1540

1790

 

1540–1790

 

VII

1790

2040

 

1790 и более

 

Чтобы не писать каждый раз от ... до …, границы групп обозначают сле-

дующим образом: 290 – 540, 540 – 790 и т.д.

Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором варианте первая и последняя группы – это группы с открытыми интервалами. Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у

11

последнего. Например, открытыми будут первый и последний интервалы в группировке населения по размеру среднедушевого дохода (табл. 1.2). Закрытыми называются интервалы, у которых обозначены обе границы. Ширина открытого интервала принимается равной ширине смежного с ним интервала.

При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i–го интервала равна нижней границе i+1–го интервала. Примером такой группировки является приведенная в табл. 1.5 группировка предприятий по стоимости основных фондов.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должно войти предприятие со стоимостью фондов 790 млн руб. Если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то предприятие должно быть отнесено к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу объекта, у которой значение признака совпадает с границами интервалов, можно использовать открытые интервалы. Так, единицы объекта (табл.1.3), у которых размер среднедушевого денежного дохода равен 40 тыс. руб., попали во вторую группу (так как верхняя граница первой группы построена попринципу«исключительно»), а80 тыс. руб. – втретьюгруппуит.д.

Если в основании группировки лежит дискретный признак, то нижняя гра- ницаi–гоинтерваларавнаверхнейграницеi–1–гоинтервала, увеличеннойна1.

В этом случае возможны следующие варианты построения групп (табл. 1.6) по вышеприведенному примеру.

Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.

Таблица 1.6

 

Варианты построения групп

 

 

 

 

II вариант

№ группы

I вариант

 

 

 

До 541

I

290 – 540

II

541 – 790

 

541– 790

III

791–1040

 

791– 1040

IV

1041–1290

 

1041–1290

V

1291–1540

 

1291–1540

VI

1541–1790

 

1541–1790

VII

1791–2040

 

1791 и более

12

1.4. РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения. Атрибутивными называют ряды распределения, построенные по качественным признакам. Ряд распределения принято оформлять в виде таблиц. Ниже приведен атрибутивный ряд распределения юридической помощи адвокатов гражданам. Представленный в табл. 1.7 ряд показывает, как общее число случаев юридической помощи адвокатов распределялось по видам и формам правовой помощи в 1994 г.

Таблица 1.7

Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ в 2000 г. (цифры условные)

Вид юридической помощи,

Число случаев юридической помощи

оказанной адвокатами

 

 

всего, тыс.

в % к итогу

 

 

 

 

Устные советы

5109

71,74

Поручения по ведению

991

13,92

гражданских дел

 

 

Поручения по ведению

1021

14,34

уголовных дел

 

 

Всего

7121

100,00

 

 

 

Элементами этого ряда распределения являются значения атрибутивного признака, представленного названиями видов правовой помощи, оказанной адвокатами, и числа случаев, относящихся к каждому виду и форме помощи. Наибольший удельный вес (почти 70%) приходится на оказание юридической помощи в виде устных советов.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за нескольких периодов, эти данные позволят исследовать изменение структуры.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значения варьирующего признака. Частота – это количество элементов совокупности, которые имеют данное значение признака. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

13