Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
154
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

10.1. Понятие, виды рядов распределения и их построение

231

 

Окончание табл.

Объем инвестиций в основной капитал xi,

Число предприятий fi

млн руб.

 

44—57

15

57—70

12

70—83

6

83—96

5

 

 

Итого

52

 

 

Первым этапом изучения вариационного ряда является его гра фическое изображение. Дискретный вариационный ряд изобража ется в виде полигона распределения частот, являющегося разновид ностью статистических ломаных. Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.

Построим гистограмму распределения частот. Для этого по оси абсцисс отложим значения интервалов, характеризующих объем инвестиций в основной капитал, а по оси ординат – число пред приятий. Выстроенные прямоугольники, основания которых со ответствуют величинам интервалов, а высота – соответствующим частотам, будут представлять собой гистограмму распределения (рис. 10.1).

Число предприятий

16

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

0

18

31

44

57

70

83

96

5

Объем инвестиций в основной капитал, млн руб.

Рис. 10.1. Гистограмма распределения предприятий области по объему инвестиций в основной капитал

232

Глава 10. Ряды распределения

Для графического изображения вариационных рядов может так же использоваться кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накоплен ные частоты определяются путем последовательного суммирова ния частот по группам и показывают, сколько единиц совокупнос ти имеют значение признака не больше значения, соответствующего определенной накопленной частоте. При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат — накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем точки пересечения перпенди куляров соединяются и получают ломаную линию, т.е. кумуляту. Изображение вариационного ряда в виде кумуляты особенно эф фективно для вариационных рядов, частоты которых выражены в долях или процентах в сумме частот ряда, принятой соответствен но за единицу или за 100%, т.е. частостями.

Объем инвестиций

Число

Число пред

Накопленная

в основной капитал xi,

предприятий

приятий di,

частота

млн руб.

fi

% к итогу

Si

1

2

3

4

 

 

 

 

18—31

5

9,6

9,6

31—44

9

17,3

26,9

44—57

15

28,9

55,8

57—70

12

23,1

78,9

70—83

6

11,5

90,4

83—96

5

9,6

100

 

 

 

 

Число предприятий,

 

 

 

 

 

накопленный %

 

 

 

 

 

120

 

 

 

 

 

100

 

 

 

 

 

80

 

 

 

 

 

60

 

 

 

 

 

40

 

 

 

 

 

20

 

 

 

 

 

0

 

 

 

 

 

31

44

57

70

83

96

Объем инвестиций в основной капитал, млн руб.

Рис. 10.2. Кумулята распределения предприятий области по объему инвестиций в основной капитал

10.2. Показатели центра распределения и степени вариации

233

Если поменять местами оси координат в кумуляте, то получим новый вид графического изображения — огиву.

10.2. Показатели центра распределения и степени вариации

Анализ вариационного ряда осуществляется с помощью пока зателей центра распределения, вариации и формы распределения.

К показателям центра распределения относят среднюю, моду и медиану.

По данным вариационного ряда распределения средняя величи0 на рассчитывается как арифметическая взвешенная:

на основе частот: x = xi fi ;

fi

на основе частостей: x = Σxidi, где Σdi = 1, i = 1 n.

Если используется интервальный ряд распределения, то допус кая, что распределение в границах i го интервала является рав номерным, как вариант xi, используют середину интервала (xi′) (табл. 10.3).

 

 

 

 

 

Таблица 10.3

Объем инвестиций

Число

xi

xifi

Si

 

(xi′ −

x

)2 fi

в основной капитал xi,

предприятий

 

 

 

 

 

 

 

млн руб.

fi

 

 

 

 

 

 

 

1

2

3

4

5

 

6

 

18—31

5

24,5

122,5

5

 

4 805,0

31—44

9

37,5

337,5

14

 

2 916,0

44—57

15

50,5

757,5

29

 

375,0

57—70

12

63,5

762,0

41

 

768,0

70—83

6

76,5

459,0

47

 

2 646,0

83—96

5

89,5

447,5

52

 

5 780,0

 

 

 

 

 

 

 

Итого

52

2 886,0

 

 

17 290,0

 

 

 

 

 

 

 

 

 

Так, по данным примера средняя величина будет равна

=2886,0 =

x 55,5. 52

Вдискретном ряду мода (Мо) определяется визуально по мак симальной частоте или частости.

fMo–1 fMo+1

234

Глава 10. Ряды распределения

В интервальном ряду по наибольшей частоте определяется мо дальный интервал, а конкретное значение моды в интервале вы числяется по формуле

где XMo — нижняя граница модального интервала; h — ширина модального интервала;

fMo — частота модального интервала;

— частота интервала, предшествующего модальному;

— частота интервала, следующего за модальным.

По данным примера модальным является интервал 44—57 (fmax =

=15). Модальный объем инвестиций в основной капитал составит:

Вдискретном ряду распределения медиана (Ме), а в интерваль ном ряду — медианный интервал будет соответствовать первому значению признака (интервалу), накопленная частота которого превысит половинную сумму частот. Конкретное значение медиа ны для интервального ряда определяется по формуле

где XMe — нижняя граница медианного интервала; h — ширина медианного интервала;

SMe–1 — накопленная частота интервала, предшествующего медиан ному;

fMe — частота медианного интервала.

По данным примера медианным является интервал 44—57 (1/2Σ fi = 52 / 2 = 26; первая накопленная частота, превышающая половинную сумму частот, равна 29). Медианный объем инвести ций в основной капитал составит

Рассмотренные обобщающие показатели центра распределения не раскрывают характера последовательного изменения частот,

10.2. Показатели центра распределения и степени вариации

235

поэтому в анализе закономерностей распределения используются также ранговые (порядковые) показатели: квартили и децили.

Квартили (Q) — это значения вариантов, которые делят упоря доченный ряд по объему на четыре равновеликие части. Следова тельно, в ряду распределения выделяют три квартиля. Нижний квартиль (Q1) отделяет 1/4 часть совокупности с наименьшими зна чениями признака, верхний (Q3) отсекает 1/4 часть с наибольшими значениями признаков. Это означает, что 25% единиц совокупнос ти будут меньше по величине Q1; 25% единиц будут заключены меж ду Q1 и Q2; 25% — между Q2 и Q3 и остальные 25% превосходят Q3. Медиана является одновременно вторым квартилем.

Расчет квартилей основывается на кумулятивных частотах (час тостях) и определяются первый и третий квартили по формулам

где xQ1 — нижняя граница интервала, содержащего нижний квартиль (ин тервал определяется по накопленной частоте, первой превышающей 25%); xQ3 — нижняя граница интервала, содержащего верхний квартиль (ин тервал определяется по накопленной частоте, первой превышающей 75%);

h — величина интервала;

SQ1 – 1 — накопленная частота интервала, предшествующего интерва лу, содержащему нижний квартиль;

SQ3 – 1 — накопленная частота интервала, предшествующего интерва лу, содержащему верхний квартиль;

fQ1 — частота интервала, содержащего нижний квартиль; fQ3 — частота интервала, содержащего верхний квартиль.

По данным примера

Децили — это значения вариантов, которые делят упорядочен ный ряд по объему на десять равных частей. В ряду распределения

236

Глава 10. Ряды распределения

выделяют девять децилей (медиана является пятым децилем). Рас чет децилей также основан на кумулятивных частотах (частостях) и определяется по формулам

и т.д.

По данным примера

Для измерения и оценки вариации используют абсолютные и относительные характеристики.

По данным примера

Коэффициент вариации свидетельствует об однородности рас пределения:

Следовательно, средняя арифметическая является достаточно типичной оценкой данного ряда.

Анализ вариации в рядах распределения целесообразно допол нить показателями дифференциации.

По ряду распределения определяется коэффициент децильной дифференциации (KD) по формуле

где D9 – девятая дециль; D1 – первая дециль.

10.3. Показатели формы распределения

237

Он показывает, во сколько раз наименьший уровень признака из 10% единиц, имеющих наибольший уровень признака, больше наибольшего уровня признака, из 10% единиц совокупности, име ющих наименьший уровень признака.

т.е. наименьший уровень вложений в основной

капитал в 10% предприятий, производящих наибольшие инвести ции, в 2,6 раза превышает наивысший уровень вложений в основ ной капитал в 10% предприятий, производящих наименьшие ин вестиции.

По первичным данным исчисляется коэффициент фондовой дифференциации (Kф) по формуле

где X max — средний уровень признака из 10% наибольших значений признака;

X min — средний уровень признака из 10% наименьших значений признака.

10.3. Показатели формы распределения

Выявление общего характера распределения предполагает оцен ку не только степени его однородности, но и его симметричности, остро и плосковершинности. Симметричным называется распре деление, в котором частоты любых двух вариантов, равноотстоя щих в обе стороны от центра распределения, равны между собой. Для симметричных распределений имеет место равенство средней арифметической, моды и медианы.

В практических расчетах часто в качестве оценки асимметрии используется нормированный коэффициент третьего порядка:

где μ3 — центральный момент третьего порядка.

238

Глава 10. Ряды распределения

Если As < 0, то определяется левосторонняя асимметрия. При As > 0 правосторонняя (рис. 10.4). As = 0 свидетельствует о сим метричном распределении.

As < 0

As > 0

Рис. 10.3. Левосторонняя

Рис. 10.4. Правосторонняя

асимметрия

асимметрия

μ3 = (24,5 − 55,5)3 5 + (37,5 − 55,5)3 9 + (50,5 − 55,5)3 15 +

52 + (63,5 − 55,5)3 12 + (76,5 − 55,5)3 6 + (89,5 − 55,5)3 5 = 1056,

 

 

52

 

As =

μ3

=

1056

= 0,174.

σ 3

 

 

6 063,3

 

Следовательно, исходный ряд имеет незначительную правосто роннюю асимметрию.

При оценке крутизны в качестве эталонного выбирается нор мальное распределение, которое сравнивается с фактическим, и вычисляется показатель эксцесса распределения (Еk):

E = μ4 3,

k σ 4

где μ4 — центральный момент 4 го порядка, определяемый по формуле

10.3. Показатели формы распределения

239

 

 

(xi

 

)4 fi

.

 

μ4

=

x

 

 

 

 

 

 

 

fi

 

При симметричном распределении Еk = 0. Если Еk > 0, распре деление является островершинным (рис. 10.5); если Еk < 0 – плос ковершинным (рис. 10.6).

Ek > 0

Ek < 0

Рис. 10.5. Островершинное

Рис. 10.6. Плосковершинное

распределение

распределение

μ4 = (24,5 − 55,5)4 5 + (37,5 − 55,5)4 9 + (50,5 − 55,5)4 15 + 52

+ (63,5 − 55,5)4 6 + (89,5 − 55,5)4 5 = 237 657, 52

E = μ4 − 3 = −0,85.

k σ 4

Следовательно, исходный вариационный ряд имеет распреде ление, близкое к нормальному.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпири ческое распределение к типу нормального распределения.

Оценка существенности коэффициента асимметрии произво дится на основе средней квадратической ошибки коэффициента

В случае

240

Глава 10. Ряды распределения

асимметрии (σАs ), которая зависит от числа наблюдений (n) и рас считывается по формуле

σ A =

6(n − 1)

.

(n + 1)(n + 3)

s

 

 

 

As > 3 асимметрия существенна и распределение при

σ A

знака в генеральной совокупности несимметрично. В противном случае асимметрия несущественна, и ее наличие может быть выз вано случайными обстоятельствами.

По результатам расчетов σA =

6(n − 1)

=

6(52 − 1)

= 0,105,

(n + 1)(n + 3)

(52 + 1)(52 + 3)

s

 

 

 

 

 

 

аAs = 0,174 = 1,66 < 3. Следовательно, распределение признака σA 0,105

симметрично.

Среднеквадратическая ошибка эксцесса (σЕs ), рассчитывается по формуле

σ =

24n(n − 2)(n − 3)

,

Es

(n

2

 

 

1) (n + 3)(n + 5 )

где n – число наблюдений.

Для определения асимметрии и эксцесса можно пользоваться упрощенными формулами, предложенными Линдбергом:

As = Р – 50,

где Р — удельный вес (%) количества тех вариант, которые превосходят среднюю арифметическую, в общем количестве вариант данного ряда;

50 — удельный вес (%) вариант, превосходящих среднюю арифмети ческую ряда нормального распределения;

Еk = Р – 38,29,

где Р — удельный вес (%) количества тех вариант, которые лежат в интер вале, равном половине среднего квадратического отклонения (в ту или иную сторону от величины средней в общем количестве вариант данного ряда);

38,29 — удельный вес (%) вариант, лежащих в интервале, равном по ловине среднего квадратического отклонения (в ту или иную сторону от