Shmoylova_R_A_Minashkin_V_G_Gusynin_A_B_Sadovn
.pdfПроиллюстрируем познавательное значение медианы следующим примером.
Допустим, нам необходимо дать характеристику среднего дохода группы людей, насчитывающей 100 человек, из которых 99 имеют доходы в интервале от 100 до 1000 долл. в месяц, а месячные доходы последнего составляют 50000 долл.:
№ п/п |
1 |
2 |
3 |
4 ... |
50 |
51 ... |
99 |
100 |
Доход |
100 |
104 |
104 |
107 ... |
162 |
164 ... |
200 |
50000 |
(долл.) |
|
|
|
|
|
|
|
|
Если мы воспользуемся средней арифметической, то получим средний доход, равный примерно 600-700 долл., который не только в несколько раз меньше дохода 100-го человека, но и имеет мало общего с доходами остальной части группы. Медиана же, равная в данном случае 163 долл., позволит дать объективную характеристику уровня доходов 99% данной совокупности людей.
Рассмотрим определение моды и медианы по сгруппированным данным (рядам распределения).
Предположим, распределение торговых предприятий города по уровню розничных цен на товар А имеет следующий вид :
Цена, |
Число торговых |
руб. |
предприятий |
52 |
12 |
53 |
48 |
54 |
56 |
55 |
60 |
56 |
14 |
Всего |
190 |
Определение моды по дискретному вариационному ряду не состав
ляет большого труда - наибольшую частоту (60 предп.) имеет цена 55 руб., следовательно она и является модальной.
Для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда:
N me = |
n +1 |
(5.16) |
|
||
2 |
|
|
91 |
|
где n - объем совокупности.
В нашем случае |
N me = |
190 +1 |
= 95,5. |
||
|
2 |
||||
|
|
|
Полученное дробное значение, всегда имеющее место при четном числе единиц в совокупности, указывает, что точная середина находится между 95 и 96 предприятиями. Необходимо определить, в какой группе находятся предприятия с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты. Очевидно, что магазинов с этими номерами нет в первой группе, где всего лишь 12 торговых предприятий, нет их и во второй группе (12+48=60). 95-ое и 96-ое предприятия находятся в третьей группе (12+48+56=116) и, следовательно, медианой является цена 54 руб.
Вотличие от дискретных вариационных рядов определение моды
имедианы по интервальным рядам требует проведения определенных расчетов на основе следующих формул :
Мо = хо +i × |
|
(fM o −fM o −1) |
(5.17) |
|
(fM o |
−fM o −1) +(fM o −fM o +1) |
|||
|
|
где |
Хо |
- |
|
i |
- |
|
fМо |
- |
|
fМо-1 - |
fМо+1 -
и
нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту); величина модального интервала;
частота модального интервала; частота интервала, предшествующего модальному;
частота интервала, следующего за модальным.
|
|
|
|
1 ∑fi −sMe−1 |
|
|
|
|
Me |
= x0 +i× |
2 |
|
|
|
|
fMe |
(5.18) |
|||
|
|
|
|
|||
где |
Хо |
- |
нижняя граница медианного интервала (меди- |
|||
|
|
|
анным называется первый интервал, накоп- |
|||
|
|
|
ленная частота которого превышает половину |
|||
|
|
|
общей суммы частот); |
|
||
|
i |
- |
величина медианного интервала: |
|
||
|
Sme-1 |
- |
накопленная частота интервала, предшест- |
|||
|
fMe |
|
вующего медианному; |
|
||
|
- |
частота медианного интервала. |
|
|||
|
|
|
92 |
|
|
Проиллюстрируем применение этих формул, используя данные таблицы 5.5.
Информация, подобная представленной в этой таблице, необходима для получения четкого представления о покупательной способности населения страны или региона, для оценки эластичности спроса и, в конечном итоге, для выбора того или иного метода ценообразования и обоснования окончательной цены на товар.
Таблица 5.5.
Распределение населения РФ по уровню среднедушевого денежного дохода в январе-августе 1995 г.
Среднедушевой денежный доход (в |
Удельный вес населения, % |
среднем за месяц), тыс.руб. |
|
100 и менее |
2,4 |
100 - 200 |
15,4 |
200 - 300 |
20,1 |
300 - 400 |
17,2 |
400 - 500 |
12,8 |
500 - 600 |
9,2 |
600 - 700 |
6,5 |
700 - 800 |
4,5 |
800 - 900 |
3,2 |
900 - 1000 |
2,3 |
свыше 1000 |
6,4 |
Всего |
100,0 |
Интервал с границами 200 - 300 в данном распределении будет модальным, так как он имеет наибольшую частоту. Использую формулу (5.17), определим моду :
М0 = 200 +100 × |
20,1−15,4 |
= 262 тыс.руб. |
(20,1−15,4) +(20,1−17,2) |
Для определения медианного интервала необходимо определять накопленную частоту каждого последующего интервала до тех пор, пока она не превысит 1/2 суммы накопленных частот (в нашем случае - 50%) :
Интервал |
Накопленная |
|
частота, % |
100 и менее |
2,4 |
100 - 200 |
17,8 |
200 - 300 |
37,9 |
300 - 400 |
55,1 |
Мы определили, что медианным является интервал с границами 300 - 400. Определим медиану :
93
M е = 300 +100 × 50,0 −37,9 = 370 тыс.руб. 17,2
Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. Если Мо<Me<Х - имеет место правосторонняя асимметрия, при Х<Me< Мо следует сделать вывод о левосторонней асимметрии ряда.
На основе полученных в последнем примере значений структурных средних можно заключить, что наиболее распространенным, типичным является среднедушевой доход порядка 260 тыс.руб. в месяц. В то же время, более половины населения располагает доходом свыше 370 тыс.руб. при среднем уровне 435 тыс.руб. (средняя арифметическая взвешенная). Из соотношения этих показателей следует вывод о правосторонней асимметрии распределения населения по уровню среднедушевых денежных доходов, что позволяет предполагать о достаточной емкости рынка дорогих товаров повышенного качества и товаров престижной группы.
94
Глава 6. Анализ вариации.
6.1. Основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать и разброс или вариацию значений отдельных единиц, которая является важной характеристикой изучаемой совокупности. В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды и в разных местах.
Основными показателями, характеризующими вариацию, являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Для иллюстрации расчетов этих показателей воспользуемся следующими данными:
Таблица 6.1
Итоги торгов на валютных биржах России 21 января 1999г. (спецсессия)
Биржа |
Курс, руб./долл. |
Оборот, млн.долл. |
|
США |
США |
ММВБ |
22,73 |
158,0 |
СПВБ |
22,63 |
10,0 |
УРВБ |
22,42 |
3,0 |
СМВБ |
22,40 |
2,9 |
АТМВБ |
22,64 |
0,7 |
СВМБ |
22,83 |
1,6 |
НФВБ |
22,56 |
0,7 |
Простейшим показателем, уже использованным выше при группировке данных, является размах вариации. Он представляет собой разность максимального и минимального значений признака:
R=Xmax-Xmin=22,83-22,40=0,43 руб.
Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ. Этого недостатка лишена дисперсия, рассчитываемая как средний квадрат отклонений значений признака от их средней величины:
95
|
|
|
∑(xi − |
|
)2 |
|
|
σ |
2 |
= |
x |
невзвешеннаяформула |
(6.1) |
||
|
n |
||||||
|
|
|
∑(xi − |
|
)2 fi |
|
|
σ |
2 |
= |
x |
взвешеннаяформула |
(6.2) |
||
|
∑fi |
По данным нашего примера определим средневзвешенный курс доллара по итогам всех торгов и рассчитаем дисперсию:
х = 22,73×158,0 + 22,63×10,0 + ... + 22,56 ×0,7 = 22,71руб. 158,0 +10,0 + ... + 0,7
σ 2 = (22,73 − 22,71)2 ×158,0 + (22,63 − 22,71)2 ×10,0 +... + (22,56 − 22,71)2 ×0,7 = 0,004 158,0 +10,0 +... + 0,7
Дисперсию в отдельных случаях удобнее рассчитывать по другой формуле, представляющей собой алгебраическое преобразование выра-
жений (5.19.) и (5.20.):
σ 2 = |
|
|
- ( |
|
)2 |
|
|
|
|
|
|
|||
x 2 |
|
|
|
|
|
|
||||||||
|
x |
|
|
|
|
|
(6.3) |
|||||||
|
|
|
|
|
|
∑xi2 |
|
|
|
|
∑xi2 fi |
|||
|
|
|
|
|
|
|
|
|
|
|||||
гдеx |
2 |
= |
или x |
2 |
= |
|
||||||||
|
|
|
n |
|
∑fi |
(6.4) |
Наиболее удобным и широко распространенным на практике по-
казателем является среднее квадратическое отклонение. Оно опреде-
ляется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак:
|
∑(xi - |
|
)2 |
|
|
|
σ = |
x |
невзвешеннаяформула |
(6.5) |
|||
n |
||||||
|
|
|
||||
σ = |
∑(xi - x)2 fi |
взвешеннаяформула |
|
|||
∑fi |
(6.6) |
|||||
|
|
|
|
|
Внашем случае получим:
σ= 0,004 = 0,06 руб.
Рассмотренная величина показывает, что курсы доллара на биржах отклонялись от средневзвешенного курса в среднем на 17,4 руб.
Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении, относительно среднего уровня, что во многих случаях является предпочтительнее:
96
σ |
×100% |
(6.7) |
|||
|
|
|
|||
V = x |
|||||
|
Определим значение этого показателя по нашим данным:
V = 22,710,06 ×100% = 0,26%
Рассчитанная величина свидетельствует об очень незначительном относительном уровне колеблемости курса доллара. Если V не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.
Информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. При этом показатели, рассчитанные по одной совокупности, сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени. Например, исследуется динамика вариации курса доллара по недельным или месячным данным.
6.2. Использование показателей вариации в анализе взаимосвязей.
Показатели вариации могут быть использованы не только в анализе колеблемости или изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т.е. в анализе взаимосвязей между показателями.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками - факторным и результативным. Факторным называется признак, оказывающий влияние на взаимосвязанный с ним признак. В свою очередь, этот второй признак, подверженный влиянию, называется результативным.
Для выявления взаимосвязи исходная совокупность делится на две или более групп во факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:
σ02 = σ2 + δ2 |
(6.8) |
где ó02 - общая дисперсия; ó2 - средняя из внутригрупповых дисперсий;
ä2 - межгрупповая дисперсия.
Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием признака фактор-
97
ного. Это воздействие проявляется в отклонении групповых средних от общей средней:
δ2 = |
∑(х |
i |
− x |
0 |
)2 n |
i , |
(6.9) |
|
|
|
∑ni |
|
|
|
где хi - среднее значение результативного признака по i-ой группе; x 0 - общая средняя по совокупности в целом;
ni - объем (численность) i-ой группы.
Если факторный признак, по которому производилась группировка, не оказывает никакого влияния не признак результативный, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая дисперсия будет равна нулю.
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:
σ2 = |
∑σi2 ni , |
(6.10) |
|
∑ni |
|
где σi2 -дисперсия результативного признака в i-ой группе; ni -объем (численность) i-ой группы.
Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:
ηэ = |
δ2 |
(6.11) |
|
σ2 |
|||
|
|
||
|
0 |
|
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
На следующем условном примере исследуем зависимость между собственными и привлеченными средствами коммерческих банков региона:
98
|
|
Таблица №6.2 |
Банк |
Собственные средства, млн.руб. |
Привлеченные средства, млн. |
|
|
руб. |
1. |
70 |
300 |
2. |
90 |
400 |
3. |
140 |
530 |
4. |
110 |
470 |
5. |
75 |
255 |
6. |
150 |
650 |
7. |
90 |
320 |
8. |
60 |
240 |
9. |
95 |
355 |
10. |
115 |
405 |
Если взаимосвязь между рассматриваемыми показателями существует, то она обусловлена влиянием объема собственных средств на объем привлеченных средств. Поэтому объем собственных средств выступает в данном примере в качестве факторного признака (X), а объем привлеченных средств в качестве результативного признака (Y).
Произведем группировку банков, выделив две группы по величине собственных средств, например, группу “да 100 млн.руб.” и группу “100 млн. руб. и более”. Результаты такой группировки представлены в следующей таблице:
|
|
Таблица №6.3 |
№ |
Собственные средства, млн. |
Привлеченные средства, млн. |
группы |
руб. |
руб. |
1. |
До 100 |
300 400 255 320 240 355 |
2. |
100 и более |
530 470 650 405 |
Расчет эмпирического корреляционного отношения включает несколько этапов:
1) |
рассчитываем групповые средние: |
|
||||||
|
|
|
|
xi |
= |
∑xij |
, |
|
|
|
|
|
|
||||
|
|
ni |
||||||
|
|
|
|
|
|
|
||
где i- номер группы; |
|
|
|
|||||
j- номер единицы в группе. |
|
|
|
|||||
x1 |
= |
300 + 400 + ... + 355 |
= 311,7млн.руб; |
|||||
6 |
||||||||
|
|
|
|
|
|
|||
x 2 |
= |
|
530 +......................... + 405 |
= 513,8млн.руб; |
||||
4 |
|
|||||||
|
|
|
|
|
|
В данном примере при расчете групповых средних мы использовали невзвешенные формулы. Однако, при повторении вариантов для расчета
99
необходимо использовать средние взвешенные. 2) рассчитываем общую среднюю:
x 0 = |
∑xi ni |
= |
311,7 6 + 513,8 4 |
= 392,5млн.руб |
|
∑ni |
10 |
||||
|
|
|
Данную среднюю также можно было получить как отношение суммы всех единиц исходной совокупности (без учета деления на группы) к объему всей совокупности, т.е. к общему числу единиц.
3)рассчитываем внутригрупповые дисперсии:
σi2 = ∑(xijn−i xi )2 ;
σ12 |
= |
(300 − 311,7)2 |
+ (400 − 311,7)2 + .... + (355 − 311,7)2 |
= 3039; |
|
|
6 |
|
|||
|
|
|
|
|
|
σ22 |
= |
(530 − 513,8)2 |
+... + (405 − 513,8)2 |
=8142. |
|
|
4 |
|
|||
|
|
|
|
|
Если бы варианты имели веса, то для расчета внутригрупповых дисперсий также требовались бы взвешенные формулы.
4) вычисляем среднюю из внутригрупповых дисперсий:
σ2 = 3039 6 + 8142 4 = 5080 10
5) определяем межгрупповую дисперсию:
δ2 = (311,7 − 392,5)2 6 + (513,8 − 392,5)2 4 = 9803 10
находим общую дисперсию по правилу сложения:
σ02 = 5080 + 9803 =14883.
На этом этапе возможна проверка правильности выполненных ранее расчетов. Если возвратиться к исходной совокупности и не раздета ее на группы рассчитать дисперсию признака “у”, то она должна совпасть с общей дисперсией, полученной по правилу сложения.
рассчитываем эмпирическое корреляционное отношение:
ηэ = |
9803 |
= 0,81. |
|
14883 |
|
Полученная величина свидетельствует о том, что фактор, положенный в основание группировки (собственные средства), существенно влияет на размер привлеченных банками средств.
100