Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
154
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

10.4. Кривые распределения

241

величины средней), в общем количестве вариант ряда нормального рас пределения.

Следует отметить, что показатели асимметрии и эксцесса, ха рактеризующие форму распределения признака в пределах изучае мой совокупности, имеют не только описательное значение. Так, появление значительного отрицательного эксцесса может указы вать на качественную неоднородность исследуемой совокупности. Кроме того, эти показатели позволяют сделать вывод о возможно сти применения данного эмпирического распределения к типу кри вых нормального распределения.

10.4. Кривые распределения

Распределение, построенное на основании исходных данных, называется эмпирическим. Данные эмпирического распределения являются выборочными, поэтому оно связано со случайными ошиб ками. При увеличении числа наблюдений в пределе мы приходим к плавной кривой, характеризующей теоретическое распределение или закономерность изменения величины признака.

Впрактике статистического исследования приходится встречать ся с самыми различными распределениями. Однородные совокуп ности характеризуются, как правило, одновершинными распреде лениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. При появлении двух и более вершин нуж но перегруппировать данные с целью выделения более однородных групп.

Внастоящее время изучено значительное число различных форм распределений. В практике статистических исследований часто используются распределение Пуассона, Максвелла, особенно нор0 мальное распределение. Распределения, близкие к нормальному рас пределению, были обнаружены при изучении самых различных яв лений как в природе, так и в развитии общества.

Если непрерывная случайная величина имеет плотность распре деления

 

1

e

( x

x

)2

f (x) =

2 ,

 

2π σ

 

 

 

 

то она подчиняется закону нормального распределения.

242

Глава 10. Ряды распределения

Укажем особенности кривой нормального распределения.

1. Кривая симметрична относительно максимальной ординаты.

 

 

= = Me, ее

Максимальная ордината соответствует значению x

величина равна

1

.

 

 

 

2π σ

 

2.Кривая асимптоматически приближается к оси абсцисс, про должаясь в обе стороны до бесконечности. Следовательно, чем больше значения отклоняются от x, тем реже они встречают ся. Одинаковые по абсолютному значению, но противополож ные по знаку отклонения значений переменной х от x равноверо ятны.

3.Кривая имеет две точки перегиба, находящиеся на расстоя нии ± у от x.

4.При x = const c увеличением σ кривая становится более поло гой. При σ = const с изменением x кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.

5.В промежутке x + σ находится 68,3% всех значений признака.

Впромежутке x + 2σ находится 95,4% всех значений признака.

Впромежутке x + 3σ находится 99,7% всех значений признака.

В статистической практике большой интерес представляет ре шение вопроса о том, в какой мере можно считать полученное в результате статистического наблюдения распределение признака в исследуемой совокупности, соответствующее нормальному распре делению.

Для решения этого вопроса следует рассчитать теоретические частоты нормального распределения, т.е. те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения. Для расчета теоретических частот при меняется следующая формула:

 

 

n h

 

1

e

t2

 

ft

′=

 

2 ,

 

 

 

σ

 

 

 

где t — нормированное отклонение, t = x x .

σ

Величина определяется по специальной таблице.

10.4. Кривые распределения

243

Следовательно, в зависимости от величины t для каждого ин тервала эмпирического ряда определяются теоретические частоты.

Для проверки близости теоретического и эмпирического распре делений используются специальные показатели, называемые кри териями согласия. Наиболее распространенным является критерий согласия К. Пирсона χ2, исчисляемый по формуле

χ 2 = ∑ (f f )2 , f

где f — эмпирические частоты (частости) в интервале; f — теоретические частоты (частости) в интервале.

Полученное значение критерия (χ2расч) сравнивается с табличным значением (χ2табл). Последнее определяется по специальной табли це в зависимости от принятой вероятности Р и числа степеней сво боды k (для нормального распределения k равно числу групп в ряду распределения минус 3).

Если χ2расч ≤ χ2табл, то гипотеза о близости эмпирического распре деления к нормальному не отвергается.

При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико (n ≥ 50); если теоретические частоты в некоторых интервалах меньше пяти, то интервалы объединяют так, чтобы частоты были больше пяти.

Используя величину χ2, В.И. Романовский предложил оценивать близость эмпирического распределения кривой нормального рас пределения по отношению

χ 2 − (m − 3) , 2(m − 3)

где m — число групп;

m – 3 — число степеней свободы при исчислении частот нормально го распределения.

Если χ 2 − (m − 3) < 3, то можно принять гипотезу о нормальном 2(m − 3)

характере эмпирического распределения.

Распространенным критерием согласия является критерий А.Н. Колмогорова:

λ = D ,

n

244

Глава 10. Ряды распределения

где D — максимальное значение разности между накопленными эмпири ческими и теоретическими частотами;

n — сумма эмпирических частот.

По таблице значений вероятностей λ критерия находят соот ветствующую вероятность Р. Если найденной величине λ соответ ствует значительная по величине вероятность Р, то расхождения между эмпирическим и теоретическим распределениями несуще ственны.

Практическое и научное значение имеет распределение Пуас сона. Оно характерно для редко встречающихся явлений, поэто му его называют законом редких явлений (или законом малых чисел).

Закон Пуассона применяется для совокупностей, достаточно больших по объему (n ≥ 100) и имеющих достаточно малую долю единиц, обладающих данным признаком (р ≤ 0,1), например, для распределения партий готовой продукции по числу забракованных изделий, печатных страниц по числу опечаток, станков по числу отказов, ткацких станков по числу обрывов нити и т.д.

Теоретические частоты распределения Пуассона определяются формулой

где п — общее число независимых испытаний; λ — среднее число появления редкого события в п одинаковых неза

висимых испытаниях; т — частота данного события (т = 0, 1, 2 ...);

е — основание натуральных логарифмов, е = 2,71828. Величина еλ определяется по специальной таблице;

т! произведение 1 2 3 ... m; 0! — считается равным единице.

Степень расхождения теоретических и эмпирических частот оценивается с помощью критериев согласия.

На основе данных примера проверим соответствие эмпиричес кого распределения закону нормального распределения, исполь зуя критерий согласия К. Пирсона.

Для этого исчисляются теоретические частоты нормального рас пределения по формуле на с. 242.

По данным расчетов x = 55,5; σ = 18,2.

 

 

 

10.4. Кривые распределения

245

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Величина определяется по специальной таблице. Расчет теоретических частот представлен в табл. 10.5.

Таблица 10.5

Группы

Число

Центр

t

 

 

 

 

Теоре

Округ

f – f

( f f ′)2

инвести

пред

ин

 

 

 

 

 

тичес

ленные

 

 

 

 

 

 

f

 

 

 

 

ций в

прия

терва

 

 

 

 

 

кие

теоре

 

 

 

 

 

 

 

 

основ

тий

ла

 

 

 

 

 

часто

тичес

 

 

ной

f

x

 

 

 

 

 

ты

кие

 

 

капитал,

 

 

 

 

 

 

 

f

частоты

 

 

млн руб.

 

 

 

 

 

 

 

 

f

 

 

х

 

 

 

 

 

 

 

 

 

 

 

18—31

5

24,5

–1,703

0,094

 

 

3,487

3,5

1,5

0,643

31—44

9

37,5

–0,989

0,244

 

9,052

9,1

–0,1

0,001

44—57

15

50,5

–0,275

0,385

 

14,283

14,3

0,7

0,034

57—70

12

63,5

0,440

0,362

 

13,430

13,4

1,4

0,146

70—83

6

76,5

1,154

0,206

 

7,643

7,6

–1,6

0,337

83—96

5

89,5

1,868

0,069

 

2,560

2,6

2,4

2,215

Итого

52

 

 

 

 

 

 

 

50,5

 

3,376

 

 

 

 

 

 

 

 

 

 

 

 

Сопоставление на графике эмпирического распределения с те оретической кривой нормального распределения свидетельствует о достаточно хорошем согласовании распределений.

Степень расхождения теоретических и эмпирических частот оценивается с помощью критерия «хи квадрат» К. Пирсона:

Полученное значение критерия (χ2расч) сравнивается с табличным значением χ2табл, которое определяется по таблице.

При вероятности Р = 0,95 и числе степеней свободы к = 3 (6 – 3)

χ2табл = 7,8.

χ2расч< χ2табл (3,376 < 7,8), следовательно, гипотеза о близости эм пирического распределения к нормальному не отвергается.

246

Глава 10. Ряды распределения

10.5. Статистические показатели неравномерности распределения

Важной задачей статистического анализа рядов распределения является определение степени концентрации изучаемого призна ка по единицам совокупности или оценка неравномерности рас пределения. Такая неравномерность может иметь место в распре делении доходов по группам населения, капитала по группам банков, прибыли по группам предприятий и т.д.

При изучении процессов концентрации используется графичес кое изображение вариационного ряда в виде кривой Лоренца. Для ее построения абсолютные показатели числа единиц в группах и размер изучаемого признака выражаются в относительных показа телях (в долях или процентах к итогу) и исчисляются их накоплен ные значения.

При построении графика на горизонтальной линии наносится шкала для ряда накопленных частостей, а на вертикальной линии – шкала для накопленных относительных величин размера изучае мого признака. Далее наносятся точки в соответствии с накоплен ными значениями двух рядов. Соединив все точки, получают кри вую, характеризующую степень неравномерности распределения. Линия, соединяющая нижний левый угол графика с верхним пра вым (диагональ четырехугольника), является линией равномерно го распределения. Чем больше кривая отличается от диагонали, тем больше неравномерность.

При получении графических изображений вариационного ряда большое значение имеет соотношение масштабов по оси абсцисс и оси ординат. В этом случае следует руководствоваться так называе мым «правилом золотого сечения», в соответствии с которым вы сота графика должна быть примерно в 1,5 раза меньше его основа ния.

На основе графика можно рассчитать коэффициент концентра ции (индекс Джини):

KG = S0S1,

где S0 площадь между равномерным и фактическим распределением; S1 — площадь треугольника, образуемого линией равномерного рас

пределения и горизонтальной линией графика (соответствует половине площади четырехугольника).

10.5. Статистические показатели неравномерности распределения 247

Величина индекса изменяется в пределах от нуля до единицы. Для равномерного распределения она равна нулю. Чем больше сте пень концентрации, тем больше величина индекса.

Коэффициент Джини можно определить по следующей фор муле:

KG = 1 − 2∑ dxi dyiН + ∑ dxi dyi ,

где dxi — доля i й группы в общем объеме совокупности; dyi — доля i й группы в общем объеме признака;

dHyi – накопленная доля i й группы в общем объеме признака.

Коэффициент Лоренца можно определить по формуле

KL = dxi dyi .

2 Пример. Распределение коммерческих банков региона на 1 ян

варя 2006 г. по размеру капитала представлено в табл. 10.6.

Таблица 10.6

Группы банков по размеру

200—

250—

300—

350—

400 и

Итого

активов, млн руб.

250

300

350

400

более

 

Число банков

3

8

12

5

3

31

Общая сумма активов, млн руб.

675

2 200

3 900

1 875

1 275

9 925

 

 

 

 

 

 

 

Для характеристики распределения коммерческих банков по размеру капитала определим с помощью табл. 10.7 коэффициенты Джини и Лоренца и представим графическое изображение ряда в виде кривой Лоренца.

 

 

 

 

 

 

Таблица 10.7

 

 

 

 

 

 

 

Группы

 

Число банков

Общая сумма активов

банков по

частота

частость,

накопленная

млн

% к

накопленный

размеру

 

%

частость, %

руб.

итогу

% к итогу

активов,

 

 

 

 

 

 

млн руб.

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

200—250

3

9,7

9,7

675

6,8

6,8

250—300

8

25,8

35,5

2 200

22,2

29,0

 

 

 

 

 

 

 

300—350

12

38,7

74,2

3 900

39,3

68,3

 

 

 

 

 

 

 

350—400

5

16,1

90,3

1 875

18,9

87,2

400 и более

3

9,7

100,0

1 275

12,8

100,0

 

 

 

 

 

 

 

Итого

31

100,0

9 925

100,0

 

 

 

 

 

 

 

248

Глава 10. Ряды распределения

КG = 1 – 2(0,097 0,068 + 0,258 0,29 + 0,387 0,683 + 0,161 0,872 + + 0,097 1) + 0,097 0,068 + 0,258 0,222 + 0,387 0,393 + 0,1610,189 + 0,097 0,128 = 1 – 2 0,5831 + 0,2588 = 0,0926.

КL = (0,097 – 0,068) + (0,258 – 0,222) + (0,387 – 0,393) + (0,161 –

– 0,189) + (0,097 – 0,128), внизу (под чертой) 2 = 0.

Результаты расчетов свидетельствуют о практическом отсутствии концентрации банков по суммам активов.

Кривая Лоренца представлена на рис. 10.6. На график нанесены накопленные значения двух рядов (гр. 4 и 7). При соединении всех точек получена кривая, отражающая процесс концентрации капи тала.

Процент по сумме активов

 

 

 

 

120

 

 

 

 

 

 

100

 

 

 

 

 

 

80

 

 

 

 

 

 

60

 

 

 

 

 

 

40

 

 

 

 

 

 

20

 

 

 

 

 

 

0

20

40

60

80

100

120

 

 

Процент по численности банков

 

 

10.6. Кривая Лоренца

Контрольные вопросы и задания

1.Дайте определение ряда распределения.

2.Какие виды рядов распределения определяются в зависимос ти от группировочного признака?

3.Назовите основные элементы вариационного ряда распреде ления.

4.Как построить интервальный вариационный ряд?

Тесты

249

5.Назовите показатели центра распределения и методы их рас

чета.

6.В чем состоит значение проверки гипотезы о форме распре деления?

7.Каковы особенности кривых нормального распределения?

8.Какие критерии согласия используются наиболее часто?

Тесты

1.Какой ряд строится при непрерывной вариации признака? А. Дискретный вариационный ряд.

Б. Интервальный вариационный ряд. В. Временной ряд.

2.С помощью чего графически изображается дискретный вари ационный ряд?

А. Полигона.

Б. Гистограммы. В. Кумуляты.

3.При построении какого графика используются накопленные частоты?

А. Полигона.

Б. Гистограммы. В. Кумуляты.

4.Как называется ряд распределения, построенный по каче ственным признакам?

А. Атрибутивным.

Б. Дискретным вариационным. В. Интервальным вариационным.

5.Максимальное и минимальное значения признаков в сово купности равны соответственно 28 и 4. Каковы число групп и ве личина интервала при построении вариационного ряда с равными интервалами?

А. 8 и 4. Б. 6 и 4. В. 5 и 6.

250

Глава 10. Ряды распределения

6. Как можно охарактеризовать левостороннюю асимметрию распределения?

А. As < 0. Б. As > 0.

7.Каким показателем характеризуется степень концентрации изучаемого признака?

А. Коэффициентом асимметрии. Б. Модальным значением.

В. Коэффициентом Джини. Г. Коэффициентом Лоренса.

8.Как называется распределение, построенное на основании исходных данных?

А. Теоретическим. Б. Эмпирическим. В. Нормальным.

9.Какое соотношение выполняется для нормального распреде

ления?

А. x = Мо = Ме. Б. x < Мо < Ме. В. x > Мо > Ме.

10.Как рассчитывается средняя величина по данным вариаци онного ряда?

А. Как средняя гармоническая взвешенная. Б. Как средняя арифметическая взвешенная. В. Как средняя хронологическая.

Г. Как средняя геометрическая.