Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекция модуль1.doc
Скачиваний:
4
Добавлен:
15.11.2019
Размер:
846.34 Кб
Скачать

Способы определения числа групп

  1. Формула Стерджесса для определения оптимального числа групп для данной статистической совокупности.

  1. на основе показателей , где среднеквадратическое отклонение среднее арифметическое (не взвешенное) :

Величина интервала 0,5

Величина интервала

величина интервала

12 групп

9 групп

6 групп

От до

от до

от до

От до

от до

от до

От до

от до

от до

От до

от до

от до

От до

от до

от до

От до

от до

от до

От до

от до

От до

от до

От до

от до

От до

От до

От до

После определения числа групп следует определить интервалы группировки.

Интервал – значения варьирующего признака, лежащие в определенных границах.

Пример. Требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 млн. руб., а минимальное его значение – 290 млн. руб. Совокупность включает 80 единиц. Согласно формуле она разбита на 7 групп. Найдем млн. руб. Определим величину интервала: млн. руб.

После этого построим интервалы групп (варианты построения групп, если в основу положен непрерывный признак):

№ групп

1 вариант

2 вариант

1

От 290 до 540

до 540

2

От 540 до 790

540 – 790

3

От 790 до 1040

790 – 1040

4

от 1040 до 1290

1040 – 1290

5

от 1290 до 1540

1290 – 1540

6

от 1540 до 1790

1540 – 1790

7

от 1790 до 2040

1790 и более

Закрытые интервалы

первый и последний – открытые интервалы

Если в основу группировки положен дискретный признак, то варианты построения интервалов будут следующие:

№ групп

1 вариант

2 вариант

1

От 290 до 540

до 540

2

От 541 до 790

541 – 790

3

От 791 до 1040

791 – 1040

4

от 1041 до 1290

1041 – 1290

5

от 1291 до 1540

1291 – 1540

6

от 1541 до 1790

1541 – 1790

7

от 1791 до 2040

1791 и более

Неравные интервалы применяют, если значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений.

Прогрессивно возрастающие или прогрессивно убывающие интервалы основаны на прогрессии:

– для арифметической прогрессии;

– для геометрической прогрессии.

Пример:

№ групп

интервалы

1

500 – 800

2

800 – 1300

3

1300 – 2000

4

2000 – 2900

5

2900 – 4000

Специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

Произвольные интервалы требуют упорядочения единиц совокупности по возрастанию группировочного признака (или по убыванию). В полученном ряду значений признака первые его значения объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет равным 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из исходной совокупности. Оставшаяся ее часть принимается за новую совокупность, для которой повторяется алгоритм образования новой группы. И так до тех пор, пока все единицы совокупности не будут объединены в группы.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

Атрибутивные ряды распределения построены по качественным признакам.

Пример: Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ в !994 г. (цифры условные)

№ группы

Виды юридической помощи, оказанной адвокатами

Число случаев юридической помощи

всего, тыс.

В % к итогу

1

устные советы

5109

69,43

2

Составление документов

991

13,47

3

Поручения по ведению уголовных дел

1021

13,87

4

Поручения по ведению гражданских дел

238

3,23

Всего

7359

100,00

Вариационные ряды распределения построены по количественному признаку.

Варианты – отдельные значения признака, которое он принимает в вариационном раду.

Частоты – это численности отдельных вариантов или каждой группы вариационного ряда.

Частости – это частоты. выраженные в долях единицы или в процентах к итогу.

Дискретный вариационный ряд – построен по дискретному признаку.

Пример: Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ (по данным переписи населения).

№ группы

группы семей, проживающих в квартирах с числом комнат

число семей

всего, тыс. ед.

в % к итогу

1

1

4064

16,3

2

2

12399

49,7

3

3

7659

30,7

4

4 и более

832

3,3

Всего

42954

100,0

Интервальный вариационный ряд – построен по непрерывному признаку.

Пример: Группировка населения России по размеру среднедушевого дохода в апреле 1994 г.

№ гр.

Группы населения по размеру среднедушевого денежного дохода, тыс. руб. в месяц

численность населения

всего, млн. чел.

в % к итогу

1

до 40

2,4

1,6

2

40-80

23,4

15,8

3

80-120

34,8

23,5

4

120-160

29,4

19,8

5

160-200

20,7

13,9

6

200-240

13,5

9,1

7

240-280

8,7

5,9

8

280 и более

15,5

10,4

Всего

148,4

100

Полигон используется при изображении дискретных вариационных рядов.

Пример: распределение жилого фонда городского района по типу квартир (цифры условные)

№ групп

Группы квартир по числу комнат

число квартир, тыс. ед.

1

1

10

2

2

35

3

3

30

4

4

15

5

5

5

Всего

95

Пример: распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).

№ группы

группы семей по размеру жилой площади, приходящейся на одного человека, м2

число семей с данным размером жилой площади

Накопленное число семей

1

3 – 5

10

10

2

5 – 7

20

30

3

7 – 9

40

70

4

9 – 11

30

100

5

11 – 13

15

115

Всего

115

-

Гистограмма применяется для изображения интервального вариационного ряда.

Кумулята – кривая сумм накопленных частот.

Огнива – кривая сумм накопленных частот при перемене местами осей координат.