Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статстика 2.doc
Скачиваний:
4
Добавлен:
29.09.2019
Размер:
120.32 Кб
Скачать

1.4. Выполнение группировки

по количественному признаку

При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.

Интервал - количественное значение, отделяющее одну единицу (группу) от другой, т. е. интервал очерчивает количественные границы групп.

Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.

Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.

При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики - выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.

Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:

n=1+3,322LgN

где N - численность единиц совокупности. Получаем следующее соотношение:

N

15-24

25 - 44

45 - 89

90 - 179

180 - 359

360 - 719

n

5

6

7

8

9

10

Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.

Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50 - 100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.

Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой - либо культуры по урожайности). Для группировок с равными интервалами величина интервала:

i= (Xmax-Xmin)/n

где Xmax, Xmin - наибольшее и наименьшее значения признака, n - число групп.

В качестве примера произведем группировку субъектов Центрального федерального округа по внутреннему региональному продукту (таблица 1 [5]).

В состав центрального федерального округа входит 17 областей. Так как ВРП регионов распределяется равномерно и находится в границах 100 000 млн. руб., кроме Московской области, то проведем группировку с равными интервалами 16 областей. Воспользуемся формулой Стерджесса для определения оптимального количества групп:

N= 1+ 3,322Lg 16=5,000=5.

Таким образом, среди областей выделим 5 групп.

Таблица 1

Валовой региональный продукт (валовая добавленная стоимость) по субъектам Центрального федерального округа

Субъект округа

ВРП (млн.рублей)

Белгородская область

79 692,9

Брянская область

48 579,3

Владимирская область

67 022,3

Воронежская область

105 053,4

Ивановская область

36 001,3

Калужская область

53 383,0

Костромская область

32 965,4

Курская область

59 539,9

Липецкая область

98 140,6

Московская область

447 054,9

Орловская область

45 925,0

Рязанская область

66 314,2

Смоленская область

51 706,8

Тамбовская область

50 868,0

Тверская область

74 127,5

Тульская область

77 320,0

Ярославская область

104 492,2

ВРП регионов колеблется в пределах от 105 053,4 до 32 965,4 руб. (кроме Москвы и московской области), и необходимо при этом выделить 5 групп, то величина интервала, руб.:

I= (105053,4-32965,4)/5=14417.6

Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.

Прибавляя к минимальному значению признака (в данном случае 32 965,4 руб.) найденное значение интервала, получаем верхнюю границу первой группы: 32 965,4 + 14418 = 47383,4.

Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: и т.д.

В результате получим такие группы областей округа по размеру ВРП, руб.: 32 965,4 – 47 383,4; 47 383,4 – 61 801,4; 61 801,4 – 76 219,4; 76219,4 – 90637,4; 90637,4 – 105055,4.

Теперь произведем распределение областей по размеру ВПР.

Таблица 2

Распределение субъектов Центрального федерального округа по ВПР, руб.

№ группы

Группы субъектов по ВРП

Количество субъектов в группе

1

32 965,4 – 47 383,4

3

2

47 383,4 – 61 801,4

5

3

61 801,4 – 76 219,4

3

4

76219,4 – 90637,4

2

5

90637,4 – 105055,4

3

Если в распределении имеет место неопределенность: к какой группе, например, отнести регион, если его ВРП 47 383,4 руб., к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия - левое число включает в себя обозначенное значение, а правое - не включает. Значит, регион с ВРП 47 383,4 руб. (если бы такой имелся в данных), должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.

Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном выше примере), и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что регион с величиной ВРП в 105055,4 руб., равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить "105055,4 и выше". И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить "свыше 105055,4". Подобные функции выполняют слова "до", "менее" и "более".

Все сказанное выше о группировках относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.

Вторичная группировка - образование новых групп на основе ранее осуществленной группировки.

Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединение первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).

Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рассмотрим на примере распределения субъектов центрального и приволжского федеральных округов по ВРП.

Таблица 3

Группировка акционеров по размеру выплаты дивидендов на одну акцию

Центральный федеральный округ

Приволжский федеральный округ

Группы субъектов по ВРП

Количество субъектов в группе

Группы субъектов по ВРП

Количество субъектов в группе

32 965,4 – 47 383,4

3

24581,9 - 83479,9

6

47 383,4 – 61 801,4

5

83479,9 - 142377,9

3

61 801,4 – 76 219,4

3

142377,9 - 201275,9

0

76219,4 – 90637,4

2

201275,9 - 260173,9

2

90637,4 – 105055,4

3

260173,9 - 319071,9

3

Итого

16

Итого

14

Приведенные данные не позволяют сравнить распределение субъектов двух федеральных округов по размеру ВПР, так как в этих округах различны величины интервалов. Необходимо ряды интервалов привести к сопоставимому виду. За основу сравнения возьмем структуру распределения субъектов приволжского округа (как наиболее крупную). Следовательно, по центральному федеральному округу нужно произвести вторичную группировку или перегруппировку субъектов округов, образовав такое же число групп и с теми же интервалами, как в приволжском федеральном округе.

В результате перегруппировки получаем следующие сопоставимые данные, характеризующие распределение субъектов двух федеральных округов по размеру ВРП (табл. 4.).

Таблица 4

Вторичная группировка субъектов по размеру ВРП (группировка единая)

№ группы

Группы субъектов по размеру ВРП, руб.

Количество субъектов в группе

Центральный федеральный округ

Приволжский федеральный округ

1

24581,9 – 83479,9

12

6

2

83479,9 – 142377,9

4

3

3

142377,9 – 201275,9

-

0

4

201275,9 – 260173,9

-

2

5

260173,9 – 319071,9

-

3

Итого

16

14

Анализ сопоставимых данных вторичной группировки позволяет сделать вывод о том, что субъекты приволжского федерального округа имеют более высокие размеры ВРП, чем субъекты центрального федерального округа (за исключением Москвы и московской области).