Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

statistika_проц_22

.pdf
Скачиваний:
863
Добавлен:
11.04.2015
Размер:
2.41 Mб
Скачать

Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин, позволяет представить дисперсию как долю от средней величины.

V = σ 100%

(6.11)

 

x

 

 

Чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя.1

Например, предположим, что стандартное отклонение в выборке валютных счетов в банке «А» и банке «В» равно $20. Данные по банку «А» содержат информацию о счетах, средний размер которых не превышает $100. В банке «В» данные содержат информацию относительно счетов, средний размер которых достигает $1 миллион и больше. В первом случае стандартное отклонение в 20 единиц довольно велико относительно сумм счетов. Для суммы порядка $1 миллиона — что значит вариация плюс-минус $20 относительно среднего? Конечно, такая вариация очень мала. Сравнивая эти два случая, можно сказать, что такая абсолютная мера рассеяния, как среднее квадратическое отклонение, не передает существенной информации при сравнении вариационных рядов. Коэффициент вариации здесь подходит лучше.

Чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя. В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

Однако у такого способа оценки вариации есть и существенный недостаток. Например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением σ = 10 ëåò,

«состарилась» еще на 15 лет. Теперь X = 30 лет, а среднеквадрати- ческое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 100 = 66,7 %), со временем оказывается, таким образом, вполне однородной (10/30 100 %= 33,3 %).

1Использование коэффициента вариации имеет смысл при изучении вариации признака, принимающего только положительные значения. Совершенно неправильно пользоваться V в случае измерения колеблемости признака, принимающего как положительные, так и отрицательные значения. Не имеет смысла, например, V, вычисленный для изучения колеблемости среднегодовой температуры воздуха, что особенно ясно при среднегодовой температуре близкой к нулю.

181

Для более ясного представления и использования в экономикостатистическом анализе показатели вариации представлены на рисунке 6.2.

Пример 6.2. Рассмотрим пример расчета средней дневной заработной платы для работников предприятия и показателей вариации рабочих по зарплате.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 6.1

Вспомогательная таблица для расчета дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заработная

Число

 

 

 

x −

 

 

 

x −

 

f

(x −

 

)2

 

(x −

 

)2 f

рабочих,

x

xf

 

x

 

 

x

x

 

x

плата, руб.

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Äî 180

5

170

850

 

73

 

 

365

5329

 

26645

180–200

10

190

1900

 

53

 

 

530

2809

 

28090

200–220

15

210

3150

 

33

 

 

495

1089

 

16335

220–240

20

230

4600

 

13

 

 

260

169

 

 

3380

240–260

25

250

6250

 

7

 

 

175

49

 

 

1225

260–280

20

220

5400

 

27

 

 

540

729

 

 

14580

280–300

20

290

5800

 

47

 

 

940

2209

 

44180

Итого:

115

 

27950

 

 

 

 

3305

 

 

 

 

134435

Решение

Расчет показателей вариации удобнее производить с помощью вспомогательных таблиц, таких как табл. 6.1.

Средняя дневная заработная плата:

xf

x = i f = 27950/115 = 243 ðóá.

i

Среднее линейное отклонение:

 

 

xi

 

fi

 

 

 

 

 

 

 

 

 

x

 

3305

 

L =

i

=

= 28,7 ðóá.

 

 

 

fi

115

i

Следовательно, средняя заработная плата за смену колеблется в пределах от 214,3 до 271,7 руб (Х = 243±28,7).

182

Меры вариации признака

Абсолютные показатели размера вариации, выраженные в единицах измерения признака х

Интерквартильный

размах

Размах вариации

Среднее линейное отклонение

Дисперсия

Среднее

квадратическое

отклонение

σ = σ2

IQR = Q3 Q1

R = xmax xmin

L = x x n

простое

L = x x f

f

взвешенное

σ 2 = (x x)2

n

простая

σ2 = (x x)2 f

f

взвешенная

 

(x

 

)2

σ =

x

 

n

 

простое

 

 

σ =

(x x)2 f

 

f

взвешенное

Относительные показатели интенсивности вариации, выраженные в процентах

Относительный размах вариации

KR = Rx 100

Относительное линейное отклонение

KL = Lx 100

Коэффициент

вариации

V = σ 100 x

Рис. 6.2. Статистическое изучение вариации

183

Дисперсия:

 

(xi

 

)2 fi

 

 

 

 

x

 

134435

 

σ2 =

i

=

= 1169 ðóá.2

 

 

fi

115

i

Средний квадрат отклонений заработной платы от ее средней величины составляет 1169 руб. Среднее квадратическое отклонение:

σ = σ2 = 1169 = 34,2.

Средняя дневная заработная плата рабочих колеблется в пределах от 208,8 до 277,2 руб (Х = 243±34,2 руб.).

Коэффициент вариации:

V= σ 100 = 34,2 100 = 14,1 %. x 243

Величина коэффициента вариации небольшая, следовательно, разброс значений заработной платы около ее средней невелик, таким образом, можно сделать вывод, что совокупность однородна по составу, а средняя вполне представительна.

6.3. Меры вариации для сгруппированных данных. Правило сложения дисперсий

Вариация признаков, как правило, обусловлена влиянием различных факторов. Если совокупность разбить на группы по факторному признаку, то это окажет определенное влияние на значение вариации признака в группах. Выявить долю вариации, определяемую теми или иными факторами, можно разделяя всю совокупность на группы по фактору, влияние которого исследуется. Чаще всего для этих целей используются показатели вариации для сгруппированных данных. В этом случае выделяют три вида дисперсий: общую дисперсию; внутригрупповую дисперсию, межгрупповую дисперсию.

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов. Внутригрупповая дисперсия измеряет вариацию признака внутри группы, а межгрупповая дисперсия измеряет вариацию групповых средних относительно общей средней.

184

Рассмотрим простейший случай, когда исходная совокупность делится на m однородных групп по одному признаку-фактору.

Допустим, имеется распределение исходной совокупности, представленное в таблице 6.2:

Таблица 6.2

Значение

Число единиц в

j -й группе

 

 

Итого

 

признака x

 

 

 

 

 

 

 

 

 

 

1

2

 

m

 

 

 

 

x1

f1

s1

 

t1

f1 + s1

+ ... + t1

= n1

x2

f2

s2

 

t2

f2

+ s2

+ ... + t2

= n2

 

 

 

 

xk

fk

sk

 

tk

fk

+ sk

+ ... + tk

= nk

 

 

 

 

 

 

 

 

 

 

Итого

N1

N2

 

Nm

 

 

N

 

 

 

 

 

 

 

 

Сначала вычислим m частных средних, то есть среднее значе- ние признака в каждой группе:

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

=

 

xi fi

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

,

 

x

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

N1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

=

 

xisi

(6.11)

 

 

 

 

 

i=1

 

,

x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

. . .

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

=

xiti

 

 

 

 

i=1

.

 

x

 

 

 

m

 

 

 

 

 

 

 

 

 

 

Nm

 

 

 

 

 

 

 

 

 

 

 

 

На основе частных средних x1, x2,..., xm определяем общую среднюю по формуле

xîáù. =

m

k

ãäå N = Nj

= ni .

j−1

i=1

m

 

xjNj

(6.12)

j=1

N

185

Общая дисперсия совокупности

 

 

k

 

 

 

 

 

 

 

∑(xi

 

îáù. )2 ni

 

 

x

(6.13)

σîáù2

. =

i=1

 

.

 

 

 

 

 

N

 

Общая дисперсия отражает вариацию признака за счет всех условий (факторов), действующих в совокупности.

Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как отклонение групповой средней от общей средней:

 

m

 

 

 

 

 

 

∑(

 

j

 

îáù. )2 Nj

 

x

x

 

δ 2 =

j=1

 

.

(6.14)

 

 

N

Вариацию внутри каждой группы изучаемой совокупности отражает частная групповая дисперсия, которая исчисляется как сред-

ний квадрат отклонений значений признака x от частной средней xj

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

 

 

 

 

1 )2 fi

 

 

x

 

σ12

=

 

 

 

i=1

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N1

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

 

 

 

2 )2 si

 

 

 

 

x

 

σ22

=

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

(6.15)

 

 

 

N2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

 

 

m )2 ti

 

 

 

 

x

 

σm2

=

 

i=1

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

Nm

 

В общем виде частную дисперсию запишем так:

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∑ (xi

 

j )2 Nij

 

 

 

 

x

 

σj2

=

i=1

 

,

(6.16)

 

 

 

 

 

 

 

 

Nj

 

ãäå Nij — частоты от i = 1, 2, ...,

k в каждой j-группе.

 

186

Так как изучаемая совокупность разбита на несколько групп, то для всей совокупности внутригрупповую вариацию будет выражать внутригрупповая дисперсия, которая рассчитывается как средняя арифметическая из групповых дисперсий:

m

 

 

σj2Nj

 

(6.17)

σ 2 = j=1

.

N

Существует закон, связывающий три вида дисперсии.

Общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий:

 

 

 

(6.18)

σ2 = δ 2 + σ2 .

Логика этого закона проста: общая дисперсия, возникающая под воздействием всех факторов, формируется из дисперсии, возникающей за счет фактора группировки и дисперсии, возникающей под воздействием всех прочих факторов. Автор этого закона немецкий статистик Вильгельм Лексис (1837–1914).

С помощью закона сложения дисперсий можно оценить удельный вес факторов, лежащих в основе группировки, во всей совокупности факторов, воздействующих на результативный признак. Для этого применяется коэффициент детерминации, который рас- считывается как отношение факторной дисперсии к общей дисперсии результативного признака:

η2 =

δ 2 .

(6.19)

 

σ 2

 

Корень квадратный из коэффициента детерминации называют

эмпирическим корреляционным отношением:

η =

δ 2 .

(6.20)

 

σ 2

 

Эмпирическое корреляционное отношение показывает, какую часть общей колеблемости результативного признака определяет изучаемый фактор, т. е. характеризует влияние группировочного признака на результативный признак. Этот показатель принимает значения в интервале [0,1]. Если связь отсутствует, то η = 0. В этом случае дисперсия групповых средних равна нулю (δ 2 = 0), то есть все групповые средние равны между собой и межгрупповой вари-

187

ации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х. Если связь функциональная, то η = 1. В этом случае дисперсия групповых средних равна общей дисперсии (δ 2 = σ 2), то есть не будет внутригрупповой дисперсии. Это означает, что группировочный признак полностью определяет вариацию изучаемого признака, а влияние прочих факторных признаков равно нулю. Промежуточные значения η оцениваются по степени их близости к предельным (табл. 6.3).

 

 

 

 

Таблица 6.3

 

Качественная оценка связи между признаками

 

(шкала Чеддока)

 

 

 

 

 

 

η

 

Связь

η

Связь

0

 

Отсутствует

0,5–0,7

Заметная

0–0,2

 

Очень слабая

0,7–0,9

Тесная

0,2–0,3

 

Слабая

0,9–0,99

Весьма тесная

0,3–0,5

 

Умеренная

1

Функциональная

Пример 6.3. Рассчитать дисперсию, коэффициент детерминации и эмпирическое корреляционное отношение по данным таблицы.

Решение

Найдем средний размер льгот по трем областям в целом:

 

 

 

 

jNj

 

 

 

 

 

îáù. =

x

=

264,3 341,4 + 310,4 235,5 + 490,4 38,9

= 296,2 ðóá.

 

 

j

x

 

Nj

615,8

 

 

 

 

 

j

Вариация льгот по отдельным областям, обусловленная разли- чием в местах проживания пенсионеров, характеризуется межгрупповой дисперсией:

 

m

 

 

 

 

 

 

 

 

 

 

∑(

 

j

 

îáù. )2 Nj

 

 

 

 

x

x

2

2

 

 

δ2 =

j=1

 

=

(264,3 − 296,2)

341,5 + (310,4 − 296,2)

235,5

+

 

 

 

615,8

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

+

(490,4 − 296,2)2

= 2976,1.

 

 

 

 

 

 

 

 

 

 

 

615,8

 

 

 

 

188

Таблица 6.4

Группировка населения отдельных областей России по среднему размеру ежемесячных денежных льгот пенсионеров

â 2004 ãîäó

 

Средний размер

Численность

Дисперсия

Место

пенсионеров,

льгот в области

денежных льгот

òûñ. ÷åë.

(группе)

 

проживания

 

 

 

x j

N j

σ2j

 

Курская обл.

264,3

341,4

9025

Курганская обл.

310,4

235,5

2704

Камчатская обл.

490,4

38,9

2116

Итого

296,2

615,8

7171,2

Средняя из групповых дисперсий дает обобщающую характеристику случайной вариации, обусловленную отдельными факторами, кроме места проживания пенсионеров (например, характером занятости, стажем работы и т.п.):

σ2 = 9025 341,4 + 2704 235,5 + 2116 38,9 = 6171,2. 615,8

Вариация льгот в изучаемых областях России, обусловленная влиянием всех факторов, вместе взятых, определяется общей дисперсией:

σ2 = δ2 + σ2 = 2976,1 + 6171,2 = 9147,3,

отсюда

η2 =

δ2

=

2976,1

= 0,325.

σîáù2 .

9147,3

 

 

 

Полученный коэффициент детерминации показывает, что дисперсия льгот зависит от места проживания пенсионеров на 32,5 %. Остальные 67,5 % определяются множеством других неучтенных факторов.

η = η2 = 0,325 = 0,57.

Полученное значение эмпирического корреляционного отношения позволяет утверждать, что существует заметная связь между местом проживания пенсионеров и размером льгот.

189

6.4. Вариация альтернативного признака

При статистическом выражении колеблемости альтернативных признаков наличие изучаемого признака обозначается 1, а его отсутствие — 0. Доля вариантов, обладающих изучаемым признаком обозначается р, а доля вариантов, не обладающих признаком, — q. Следовательно, р + q = 1.

Найдем их среднее значение и дисперсию:

 

 

 

 

 

 

 

 

=

xf

=

1 p +0

q

= p,

 

 

 

 

 

 

 

 

x

 

 

 

 

 

(6.21)

 

 

 

 

 

 

 

 

 

 

f

 

 

p +q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x −

 

)2 f

 

(1

− p)2 p + (0 − p)2

q

 

 

2

 

x

 

2

2

σp

=

f

=

 

 

 

 

 

 

 

 

 

 

= q

p + p q = pq(p + q) = pq. (6.22)

 

 

 

 

p + q

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.

Если значения 1 и 0 встречаются одинаково часто, то дисперсия достигает своего максимума pq = 0,5 0,5 = 0,25.

Пример 6.4. На 10000 населения приходится 4000 мужчин и 6000 женщин. Определить среднее квадратическое отклонение по полу.

Решение

Доля мужчин в населении p = 4000/10000 = 0,4; доля женщин q = 6000/10000 = 0,6. Тогда дисперсия σp2 = pq = 0,4 0,6 = 0,24 , а среднее квадратическое отклонение σp = σp2 = 0,24 = 0,49 .

Правило сложения дисперсий распространяется и на дисперсии доли признака, то есть доли единиц с определенным признаком в совокупности, разбитой на группы.

Внутригрупповая дисперсия доли определяется по формуле

σ2

= p

(1

− p ).

(6.23)

p

i

 

i

 

i

 

 

 

 

Средняя из внутригрупповых дисперсий рассчитывается так:

 

pi (1 − pi )ni =

 

.

 

σpi2

=

 

pi (1 − pi )

(6.24)

 

 

ni

 

190

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]