Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
154
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

Глава 9. ПОКАЗАТЕЛИ ВАРИАЦИИ

Вариация признака — это изменение значений признака у еди ниц статистической совокупности, которые обусловлены влияни ем действия различных факторов.

Например, прибыль коммерческих юридических лиц складыва ется под влиянием внутренних и внешних факторов. К внешним факторам относятся географическое положение страны, система налогообложения, конъюнктура рынка, уровень цен на потребляе мые материально технические ресурсы и др. Наиболее значимыми внутренними факторами считаются объем выпускаемой продукции, цена, затраты, ассортимент продукции (работ, услуг). Наряду с вы числением средней прибыли, сложившейся под влиянием указан ных и прочих факторов, при сравнении статистических совокуп ностей встает вопрос об оценке вариации значений признака в данном распределении, т.е. о том, как отдельные значения изучае мого признака группируются вокруг средней, какова степень их разбросанности.

Применение показателей вариации в экономическом анализе достаточно широко: они рассчитываются для статистических со вокупностей, упорядоченных с помощью метода группировок, клас сификаций, построения рядов распределения, и позволяют оценить колебания значений изучаемого признака, однородность совокуп ности по данному признаку.

Существуют две группы показателей вариации:

1)абсолютные;

2)относительные.

Абсолютные показатели вариации. Первой абсолютной величи ной, с помощью которой измеряется вариация признака, является размах вариации.

212

Глава 9. Показатели вариации

Размах вариации (R) — это разность между наибольшим и наи меньшим значениями признака.

Он определяется следующим образом:

R = xmax xmin,

где xmax — максимальное значение признака; xmin — минимальное значение признака.

Следовательно, величина размаха вариации зависит от крайних значений признака и не отражает колеблемости признака у основ ной массы единиц совокупности.

Пример 1. Предприятие внесло начальные затраты в проект А — 350 тыс. руб., в проект Б — 780 тыс. руб., в проект В — 539 тыс. руб. Таким образом, максимальные затраты составили 780 тыс. руб., минимальные — 350 тыс. руб., размах вариации будет равен: 780 –

– 350 = 430 тыс. руб.

На практике часто требуется такой показатель, который будет отражать вариацию значений признаков от их средней (общей) ве личины. К таким показателям относятся:

среднее линейное отклонение;

дисперсия;

среднее квадратическое отклонение.

Вышеуказанные показатели вариации представляют собой сред ние показатели, полученные из отклонений индивидуальных зна чений признака от их среднего.

Среднее линейное отклонение дает обобщенную характеристи ку степени колеблемости признака в совокупности и вычисляется для несгруппированных и сгруппированных данных по следующим формулам:

d = xi x (простое); n

d = xi x fi (взвешенное).

fi

Расчет вариации с помощью среднего линейного отклонения позволяет получить неотрицательность вычисляемых значений от клонений, т.е. отклонения взаимно не уничтожают друг друга.

Глава 9. Показатели вариации

213

Рассмотрим расчет среднего линейного отклонения на следую щем примере.

Пример 2. На основании данных Банка России, представленных в табл. 9.1, нужно рассчитать среднее линейное отклонение.

Таблица 9.1

Распределение по средним размерам сделок операций с физическими лицами по покупке наличной иностранной валюты

уполномоченными банками в декабре 2007 г., тыс. ед.

Распределение по средним

Количество

xi

xi fi

 

x

 

 

 

 

f

 

 

i

x

 

i

размерам сделок операций

сделок,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с физическими лицами,

fi

 

 

 

 

 

 

 

 

 

 

 

долл.

 

 

 

 

 

 

 

 

 

 

 

 

А

1

2

3

 

 

 

4

 

 

 

 

До 250

116,60

125

14 575

175 254,585

251—500

442,52

375

165 945

554 495,700

 

 

 

 

 

501—2 000

1 474,54

1 250

1 843 175

557 436,570

 

 

 

 

 

2 001—5 000

640,20

3 500

2 240 700

1 198 428,100

 

 

 

 

 

Свыше 5 000

37,42

4 000

149 680

88 758,705

 

 

 

 

 

Итого

2 711,28

х

4 414 075

2 574 373,500

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее линейное отклонение рассчитывается следующим об разом:

а) найдем середину интервала по исходным данным: к нижней границе интервала прибавим верхнюю границу и разделим на два. Полученные значения запишем в графу 2 табл. 9.1;

б) вычислим произведения значений признака (середины ин тервалов) на соответствующие им частоты (веса) и полученные зна чения поместим в графу 3. Сложив полученные произведения, по лучим их сумму — 4 414 075;

в) рассчитаем среднюю величину по формуле средней арифме тической взвешенной:

 

 

x

fi

 

4 414 075

 

x =

=

= 1628,041 долл. ;

fi

 

2 711,28

 

 

 

 

 

г) определим произведения абсолютных отклонений вариантов признака (середина интервала) от средней величины (x), т.е. xi x на их частоты (fi ) (графа 4) и подсчитаем сумму их произведений — 2 574 373,5.

214

Глава 9. Показатели вариации

Разделив полученную сумму на сумму частот, получим величи ну среднего линейного отклонения для сгруппированных данных:

= 2 574 373,5 =

d 949,505 долл. 2 711,28

Исчисленная величина означает, что в среднем отклонение ва риантов признака от их средней величины составляет 949,505 долл. и отличается от средней на 678,536 долл. Это свидетельствует о том, что совокупность в отношении признака не является однородной,

асредняя не является типичной.

Всилу того что среднее отклонение случайной величины от ее математического ожидания равно нулю, в практике обычно ис

пользуют другой показатель. Таким показателем вариации явля ется дисперсия (σ 2). Дисперсия есть средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных рассчитывается по формулам простой дисперсии (для несгруппированных данных) и взвешен ной дисперсии (для сгруппированных данных):

σ 2 =

(xi

 

)2

 

x

(простая);

 

n

 

 

 

 

 

(xi

 

)2 fi

(взвешенная).

σ 2 =

x

 

 

 

 

 

 

fi

 

Формула для дисперсии может быть преобразована:

 

 

n

(xi

 

 

 

 

 

2

 

n

 

2

− 2xi

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x)

 

xi

x +(x)

 

σ 2 =

i=1

 

 

 

 

 

 

 

=

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

i

(

 

 

)

 

 

 

i

 

 

 

 

 

 

 

 

− 2x

x

 

 

 

 

 

 

 

 

 

 

 

=

x2

 

 

 

+ n x

 

 

=

 

x 2

 

(

 

 

)2 ,

i=1

 

 

 

i=1

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

2

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т.е. дисперсия равна средней из квадратов индивидуальных значе ний признака минус квадрат средней величины. Следовательно, дисперсия для несгруппированных данных равна

σ 2 = x2 x2 .

Глава 9. Показатели вариации

215

Для сгруппированных данных преобразованная формула для расчета дисперсии имеет вид:

k

xi2 fi

σ = i=1

k

fi

i=1

xi fi

 

2

 

k

 

 

i=1

 

 

 

.

k

 

fi

 

 

 

i=1

 

 

Среднее квадратическое отклонение рассчитывается как корень квадратный из дисперсии. Эта величина также вычисляется как простая или взвешенная в зависимости от того, какими являются исходные данные — сгруппированными или несгруппирован ными:

 

(xi

 

)2

 

 

σ =

x

 

(простое);

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

 

)2

fi

 

σ =

x

(взвешенное).

 

fi

 

 

 

 

 

 

 

 

 

 

Среднее линейное отклонение и среднее квадратическое откло нение выражаются в тех же единицах измерения, что и изучаемый признак.

В условиях нормального распределения существует определен ная взаимосвязь величины среднего квадратического отклонения

иколичества наблюдений:

в пределах x ± 1σ располагается 0,683, или 68,3% количества наблюдений;

в пределах x ± 2σ располагается 0,954, или 95,4% количества наблюдений;

в пределах x ± 3σ располагается 0,997, или 99,7% количества наблюдений.

Учитывая то обстоятельство, что на практике почти не встреча ются отклонения, которые превышают ±3σ, отклонение 3σ приня то считать максимально возможным. Это положение называют пра0 вилом трех сигм.

Пример 3. Рассмотрим расчет дисперсии и среднего квадратичес кого отклонения по данным табл. 9.2 о росте студентов в группе.

216 Глава 9. Показатели вариации

 

 

 

 

 

Таблица 9.2

Вычисление σ2 и σ по несгруппированным данным

 

 

 

 

 

 

 

 

Студенты

Рост студентов в группе, см

xi

x

 

( xi

x

)2

1

2

3

 

 

4

 

 

1

176

7,2

51,84

2

170

1,2

1,44

3

172

3,2

10,24

 

 

 

 

4

170

1,2

1,44

 

 

 

 

5

160

–8,8

77,44

6

171

2,2

4,84

7

166

–2,8

7,84

8

156

–12,8

163,84

9

175

6,2

38,44

10

172

3,2

10,24

Итого

1 688

 

 

 

367,60

По данным табл. 9.2 рассчитаем следующие показатели:

а) определим среднюю величину роста студентов по формуле средней арифметической простой:

x = xi = 1688 = 168,8 см;

n10

б) найдем отклонения ( xi x) и занесем их в графу 3. Затем воз ведем данные графы 3 во вторую степень (графа 4). Сложим дан ные графы 4 и получим их сумму — 367,6;

в) разделив указанную сумму на число единиц совокупности, получим средний квадрат отклонений индивидуальных значений признака от их средней величины:

σ 2 = (xi x)2 = 367,6 = 36,76;

n10

г) извлечем корень квадратный из исчисленной дисперсии, по лучим среднее квадратическое отклонение:

σ = 36,76 = 6,063.

Пример 4. Рассмотрим расчет показателей вариации для сгруп пированных данных на основании информации Росстата о чис ленности безработных мужчин и женщин по возрастным группам в 2005 г. (табл. 9.3).

Глава 9. Показатели вариации

217

Таблица 9.3

Распределение численности безработных по возрастным группам, % к итогу

 

Мужчины

Женщины

 

 

 

Безработные – всего

100

100

В том числе в возрасте, лет:

 

 

 

 

 

до 20

10,3

10,8

 

 

 

20—24

19,5

16,0

25—29

12,7

13,4

 

 

 

30—34

11,5

11,1

 

 

 

35—39

9,0

10,1

40—44

11,8

10,4

 

 

 

45—49

10,9

12,5

 

 

 

50—54

8,1

10,0

55—59

4,1

3,0

 

 

 

60—72

2,1

2,8

 

 

 

Рассчитаем дисперсию и среднее квадратическое отклонение по данным о распределении численности безработных мужчин по воз растным группам:

а) определим середину интервала по исходным данным и полу ченные значения запишем в табл. 9.4 (графа 2);

б) определим средний возраст безработных мужчин по возраст ным группам по формуле средней арифметической взвешенной:

в) найдем отклонения ( xi x) и возведем их во вторую степень (графа 4);

г) вычислим произведения отклонений ( xi x)2 на их частоты (fi) и подсчитаем сумму их произведений (графа 5);

д) разделим полученную сумму на число единиц совокупности (сумму частот) и получим величину дисперсии для сгруппирован ных данных:

218

Глава 9. Показатели вариации

σ2 = (xi x)2 fi =

fi

=(18 − 34,6)2 10,3 + (22 − 34,6)2 19,5 + ... + (66 − 34,6)2 2,1 =

+19,5 + ... + 2,1

= 15699,46 =

156,995;

100

е) извлечем корень квадратный из исчисленной дисперсии:

σ = 156,995 = 12,53.

Таблица 9.4

Вычисление σ2 и σ по сгруппированным данным о численности

безработных мужчин

Безработные мужчины

Мужчины, fi

xi

xi fi

(xi

 

)2

(xi

 

)2 fi

x

x

в возрасте, лет

 

 

 

 

 

 

 

 

 

1

2

3

4

5

 

 

6

 

до 20

10,3

18

185,4

275,56

2 838,268

20—24

19,5

22

429,0

158,76

3 095,820

25—29

12,7

27

342,9

57,76

733,552

30—34

11,5

32

368,0

6,76

77,74

35—39

9,0

37

333,0

5,76

51,84

40—44

11,8

42

495,8

54,76

646,168

45—49

10,9

47

512,3

153,76

1 675,984

50—54

8,1

52

421,2

302,76

2 452,356

55—59

4,1

57

233,7

501,76

2 057,216

60—72

2,1

66

138,6

985,96

2 070,516

Итого

100,0

х

3 459,9

х

15 699,46

Аналогично произведем вычисление дисперсии и среднего квад ратического отклонения по данным распределения численности безработных женщин по возрастным группам. Для наглядности расчеты представим в табл. 9.5.

Таблица 9.5

Вычисление σ2 и σ по сгруппированным данным о численности

безработных женщин

Безработные женщины

Женщины, f

x

i

x

f

i

(x

i

x

)2

(x

i

x

)2 f

i

в возрасте, лет

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

 

 

 

5

 

 

 

 

6

 

 

до 20

10,8

18

194,4

302,76

3 269,808

Глава 9. Показатели вариации

219

Окончание табл. 9.5

Безработные женщины

Женщины, f

 

x

 

x

f

 

(x

 

 

)2

(x

 

 

)2 f

 

i

i

i

i

x

i

x

i

в возрасте, лет

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

4

 

 

 

5

 

 

 

 

6

 

 

20—24

16,0

 

22

352,0

179,56

2 872,96

 

25—29

13,4

 

27

361,8

 

70,56

 

 

945,504

30—34

11,1

 

32

355,2

 

11,56

 

 

128,316

35—39

10,1

 

37

373,7

 

 

2,56

 

 

25,856

40—44

10,4

 

42

436,8

 

43,56

 

 

453,024

45—49

12,5

 

47

587,5

134,56

1 682,0

 

50—54

10,0

 

52

520,0

275,56

2 755,6

 

55—59

3,0

 

57

171,0

466,56

1 399,68

 

60—72

2,8

 

66

184,8

936,36

2 621,808

Итого

100,0

 

х

3 537,2

 

 

х

16 154,556

Средний возраст безработных женщин по возрастным группам будет следующим:

x = 18 10,8 + 22 16,0 + 27 13,4 + ... + 66 2,8 = 3537,2 = 35,372 = 35,4.

10,8 + 16,0 + 13,4 + ... + 2,8

100

Дисперсия будет равна:

σ 2 = 16154,556 =

161,546.

100 Среднее квадратическое отклонение для женщин составило:

σ = 161,546 = 12,71.

Таким образом, можем сделать вывод, что величина среднего квадратического отклонения женщин превышает величину сред него квадратического отклонения мужчин.

Относительные показатели вариации. Эти показатели характери зуют колеблемость изучаемых признаков в совокупности или од ного и того же признака в нескольких совокупностях. Эти показа тели исчисляются в виде отношения (в процентах) абсолютного показателя вариации к средней арифметической. Существуют сле дующие относительные показатели вариации:

коэффициент осцилляции (VR):

VR = R 100%; x

линейный коэффициент вариации (Vd ):

220

Глава 9. Показатели вариации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

=

d

 

100%,

или V

 

=

d

100%;

 

d

 

 

 

d

 

 

 

 

 

 

x

 

 

 

Me

коэффициент вариации (Vσ ):

Vσ = σ 100%. x

Если коэффициент вариации не превышает 33%, то совокуп ность считается однородной.

Пример 5. По данным, приведенным в табл. 9.4 и 9.5, рассчита ем коэффициент вариации, который наиболее часто применяется на практике:

V = σ 100%; d

Vмужчин = 12,53 100% = 36,2%; 34,6

Vженщин = 12,71 100% = 35,9%.

35,4

На основании полученных значений коэффициентов вариации можно сделать вывод, что рассматриваемая совокупность безработ ных женщин более однородна, чем совокупность безработных муж чин.

Вариации альтернативного признака. Альтернативный признак — это качественный признак, имеющий две взаимоисключающие раз новидности (например, население делится на мужчин и женщин, занятых и безработных, имеющих высшее образование и не имею щих и т.д.).

Отсутствие рассматриваемого альтернативного признака у той или иной единицы совокупности обозначают символом q и его долю выражают через нуль, а наличие этого признака — симво лом p и долю единиц, им обладающих, — через единицу. Соответ ственно p + q = 1, а q = 1 – p.

Среднее значение альтернативного признака будет равно

x = 1 p + 0 q = p. p + q