Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по статистике_верстка.doc
Скачиваний:
132
Добавлен:
07.06.2015
Размер:
4.23 Mб
Скачать

2.2. Средние величины

2.2.1. Методические указания и решение типовых задач

Средняя является обобщающей характеристикой совокупности единиц по качественно однородному признаку.

В статистике применяются различные виды средних: арифметическая, гармоническая, квадратическая, геометрическая и структурные средние – мода и медиана. Средние, кроме моды и медианы, исчисляются в двух формах: простой и взвешенной.

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Это объясняется тем, что в средней взаимопоглощаются те отклонения индивидуальных значений признака, которые обусловлены действием случайных факторов.

Таким образом, средняя отражает типичный уровень признака и абстрагируется от индивидуальных особенностей, присущих отдельным единицам.

Определить среднюю во многих случаях удобнее через исходное соотношение средней (ИСС) или ее логическую формулу:

.

Пример 2.7

По данным табл. 2.9 рассчитайте:

  1. среднюю численность персонала по трем предприятиям;

  2. средний фонд заработной платы по данным граф 1 и 2;

  3. средний фонд заработной платы по данным граф 1 и 3;

  4. средний фонд заработной платы, если известны данные только граф 2 и 3.

Таблица 2.9

Заработная плата предприятий АО

Предприятие

Численность промышленно-производственного персонала (ППП), чел.

Месячный фонд заработной платы, тыс. руб.

Средняя заработная плата, руб.

А

1

2

3

1

2

3

540

274

458

564,84

331,54

517,54

1046

1210

1130

Итого

1272

1413,92

?

Решение

1. Среднюю численность персонала определим по формуле простой средней арифметической:

, (2.8)

где n – объем совокупности;

xi – численность персонала на каждом предприятии.

чел.

Для определения средней заработной платы определим исходное соотношение средней. Независимо от имеющихся в нашем распоряжении данных средняя заработная плата может быть получена только через следующее отношение:

.

2. Предположим, что мы располагаем только данными гр. 1 и 2 табл. 2.9. Итоги этих граф содержат необходимые величины для расчета искомой средней. Воспользуемся формулой средней арифметической:

, (2.9)

где xii-тый вариант осредняемого признака;

f i – вес i-того варианта.

руб.

3. Если мы располагаем только данными о средней заработной плате и численности работников (гр. 1 и 3), то нам известен знаменатель исходного соотношения, но неизвестен его числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на числитель ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной

, (2.10)

таким образом, руб.

4. Допустим теперь, что в нашем распоряжении имеются лишь данные о фонде заработной платы и средней заработной плате персонала (гр. 2 и 3 табл. 2.9), т.е. нам известен числитель исходного соотношения, но не известен его знаменатель. Численность работников по каждому предприятию можно получить делением фонда заработной платы на среднюю заработную плату. Тогда расчет средней заработной платы в целом по трем предприятиям будет произведен по формуле средней гармонической взвешенной:

, (2.11)

т.е.

В подобных случаях при равенстве весов () расчет среднего показателя может быть произведен по средней гармонической невзвешенной:

. (2.12)

Пример 2.8

Рассмотрим табл. 2.10. Определим величину среднедушевого денежного дохода в целом по Российской Федерации. Исходное соотношение такой средней будет иметь следующий вид:

.

Таблица 2.10

Распределение населения РФ в 1-м квартале 1996 г. по уровню среднедушевых денежных доходов

Среднедушевой денежный доход в среднем за месяц, тыс. руб.

Численность населения,

% к итогу

До 400

400 – 600

600 – 800

800 – 1000

1000 – 1200

1200 – 1600

1600 – 2000

2000 и выше

30,2

24,4

16,7

10,5

6,5

6,7

2,7

2,3

Итого

100

Решение

Перейдем от интервалов к их серединам. При этом величину первого интервала условно приравняем к величине второго, тогда его нижняя граница будет равна 200 тыс. руб. Величину последнего интервала условно приравняем к величине предпоследнего, тогда его верхняя граница составит 2400 руб. В результате получаем следующие середины интервалов:

300 500 700 900 1100 1400 1800 2200.

Роль численности населения в данном случае выполняет его доля в общем итоге, выраженная в процентах. Для расчета воспользуемся средней арифметической взвешенной (2.10):

тыс. руб.

Следовательно, среднедушевой денежный доход в целом по Российской Федерации составлял 688,5 тыс. руб.

Наряду с рассмотренными степенными средними статистика использует для анализа вариационных рядов и структурные средние – моду и медиану.

Мода (М0) определяет собой значение изучаемого признака, повторяющееся с наибольшей частотой.

Медиана (Ме) – значение признака, которое делит ранжировочный ряд пополам. Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:

. (2.13)

Для определения медианного значения признака номер медианной единицы ряда (NMe) находят по следующей формуле:

NMe =, (2.14)

где n – объем совокупности.

Если получаем дробное значение (например 6,5), то это значит, что медиана лежит между 6 и 7 номерами значения признака.

Пример 2.9

В бригаде из 9 человек рабочие имеют следующие тарифные разряды:

4 3 4 5 3 3 6 2 6

Решение

Для определения медианы надо провести ранжирование:

2 3 3 3 4 4 5 6 6

Центральным в этом ряду является рабочий 4-го разряда. Это и будет медиана.

Так как в бригаде больше всего рабочих 3-го разряда, этот тарифный разряд будет модальным.

Если мода отражает типичный, наиболее распространенный вариант значения признака, то медиана практически выполняет функции средней для неоднородной, не подчиняющейся нормальному закону распределения совокупности. Проиллюстрируем ее познавательное значение следующим примером.

Пример 2.10

Необходимо дать характеристику среднего дохода группы людей, насчитывающей сто человек, из которых 99 имеют доходы в интервале от 100 до 200 долл. в месяц, а месячные доходы последнего составляют 50000 долл. (табл. 2.11).

Таблица 2.11

Месячные доходы исследуемой группы людей

№ п./п.

1

2

3

4

50

51

99

100

Доход, долл.

100

104

104

107

162

164

200

50000

Решение

Если мы воспользуемся средней арифметической, то получим средний доход, равный примерно 700 долл., который не только в несколько раз меньше дохода 100-го человека, но и имеет мало общего с доходами остальной части группы. Медиана же, равная в данном случае 163 долл., позволит дать объективную характеристику уровня доходов 99% данной группы людей.

Рассмотрим определение моды и медианы по сгруппированным данным (рядам распределения).

Пример 2.11

Предположим, распределение рабочих всего предприятия по тарифному разряду имеет следующий вид (табл. 2.12).

Таблица 2.12

Распределение рабочих предприятия по тарифному разряду

Тарифный разряд

Численность рабочих, чел.

2

12

3

48

4

56

5

60

6

14

Всего

190

Определение моды по дискретному вариационному ряду не составляет большого труда – наибольшую частоту (60 человек) имеет 5-й тарифный разряд, следовательно, он и является модальным.

Расчет медианы дает значение

.

Полученное дробное значение, всегда имеющее место при четном числе единиц в совокупности, указывает, что точная середина находится между 95-м и 96-м рабочими. Необходимо определить, к какой группе относятся рабочие с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты. Очевидно, что рабочих с этими номерами нет в первой группе, где всего лишь 12 человек, нет их и во второй группе (12+48=60). 95-й и 96-й рабочие находятся в третьей группе (12+48+56=116), следовательно, медианным является 4-й тарифный разряд.

Для интервальных рядов определение моды и медианы проводится по следующим формулам:

(2.15)

где хо – нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту);

i – величина модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным;

(2.16)

где хо – нижняя граница медианного интервала;

i – величина медианного интервала;

SMe-1 – накопленная частота интервала, предшествующего медианному;

fMe – частота медианного интервала.

Медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот.

Пример 2.12

Определите моду и медиану по исходным данным, представленным в табл. 2.13.

Таблица 2.13

Распределение торговых предприятий города по размеру среднесуточного товарооборота

Среднесуточный

товарооборот, млн руб.

Число предприятий

Накопленная частота

(расчетная)

до 10

5

5

10 – 20

7

12

20 – 30

13

25

30 – 40

20

45

40 – 50

18

63

50 – 60

16

79

60 и более

13

92

ИТОГО

92

-

Решение

Модальным интервалом является четвертый, так как число предприятий там максимально.

Медианным является пятый интервал, так как накопленная частота в нем больше половины суммы частот.

Используем формулы (2.15) и (2.16):

млн руб.,

млн руб.

Пример 2.13

Вдоль шоссе расположены пять магазинов. Магазины находятся на втором, пятом, десятом, двадцать пятом и шестидесятом километрах. Обработка статистических данных показала, что в среднем за период будут обращаться на базу: первый магазин – 5 раз, второй – 10 раз, третий – 15 раз, четвертый – 10 раз, пятый – 40 раз. Требуется решить вопрос о местонахождении базы снабжения так, чтобы сумма пробегов от магазинов до базы была минимальной.

Решение

По свойству медианы (2.13) сумма пробегов будет минимальной, если база снабжения расположится в точке медианы ряда.

Ряд строится так, что расположение магазинов принимается за значение признака, а число ездок – за частоту (табл. 2.14).

Таблица 2.14

xi (км)

2

5

10

25

60

mi

5

10

15

10

40

Сумма ездок равняется 80.

Номер медианы определяем по (2.14)

,

где .

Следовательно, медиана находится между 40 и 41 значениями ряда.

Значение медианы:

;

км.

Таким образом, сумма пробега будет минимальной, если база снабжения будет построена на 42,5 км шоссе.

Пример 2.14

Требуется определить среднемесячную заработную плату одного рабочего по следующим данным (графы 1 и 2 табл. 2.15).

Таблица 2.15

Месячная

зарплата, руб.

Число рабочих, f i

Середина

интервала, xi

fjxi

Накопленные частоты S

1

2

3

4

5

2400 – 2500

10

2450

24500

10

2500 – 2600

20

2550

51000

30

2600 – 2700

48

2650

127200

78

2700 – 2800

60

2750

165000

138

2800 – 2900

42

2850

119700

180

2900 – 3000

20

2950

59000

200

Итого

200

-

546400

-

Решение

Зарплата одного рабочего рассчитывается по формуле средней арифметической взвешенной (2.10):

руб.

Наибольшую частоту (60) имеет интервал (2700 – 2800).

Моду определяем по формуле (2.15):

руб.

Наиболее часто встречается зарплата в размере 2731,6 руб.

Для определения медианы вычислим её номер в ряду.

Порядковый номер медианы

.

Следовательно, сотая единица находится в интервале (2700 – 2800).

Медиану определим по формуле (2.16):

руб.,

т.е. половина рабочих получают зарплату ниже 2736,7 руб., а половина – выше.

Мода и медиана могут быть определены и графически: первая – по гистограмме, вторая – по кумуляте.

Рассмотрим гистограмму распределения (рис. 2.1), для чего на оси абсцисс построим ряд сомкнутых прямоугольников, у каждого из которых основанием служит величина интервала признака (размер заработной платы в рублях), а высотой – частота каждого интервала (число рабочих).

Р и с. 2.1. Гистограмма распределения 200 рабочих по размеру заработной платы (графическое определение моды)

В прямоугольнике, имеющем наибольшую высоту, проводим две линии, как показано на рис. 2.1, и из точки их пересечения опускаем перпендикуляр на ось абсцисс. Значение х на оси абсцисс в этой точке есть мода (М0).

Для графического отыскания медианы по накопленным частотам строим кумуляту (рис. 2.2). Для этого из верхней границы каждого интервала на оси абсцисс восстанавливаем перпендикуляр, соответствующий по высоте накопленной частоте с начала ряда по данный интервал. Соединив последовательно вершины перпендикуляров, мы получим кривую, называемую кумулятой. Из точки на оси ординат, соответствующей половине всех частот (порядковому номеру медианы), проводим прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Опустив из этой точки перпендикуляр на ось абсцисс, находим значение медианы (Ме).

Р и с. 2.2. Кумулята распределения 200 рабочих по размеру заработной платы (графическое определение медианы)

Пользуясь кумулятой, можно определить значение признака у любой единицы ранжированного ряда.

Для симметричных распределений характерно совпадение значений средней арифметической, моды и медианы. Если М0 > , то ряд будет иметь левостороннюю асимметрию (вытянутость), а если М0 < , – правостороннюю асимметрию. В умеренно асимметричных рядах соотношение между указанными показателями выражается следующим образом:

| М0 | ≤ 3 ≤| Ме |. (2.17)

В системе структурных показателей, определяющих особенности формы распределения, выступают варианты, занимающие определенное место (каждое четвертое, десятое, сотое и т.д.) в ранжированном вариационном ряду. Это квартили, децили, перцентели и др.

Квартилипредставляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий ¼ часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньшеQ1; 25% единиц будут заключены междуQ1иQ2; 25% – междуQ2 иQ3и остальные 25% превзойдутQ3.

Вторая квартиль является медианой.

Квартили в дискретном вариационном ряду определяются аналогично вычислению медианы.

Для расчета квартилей по интервальному вариационному ряду используются формулы

; (2.18)

, (2.19)

где – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);

–нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);

i – величина интервала;

–накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

–то же для верхнего квартиля;

–частота интервала, содержащего нижний квартиль;

–то же для верхнего квартиля.

Пример 2.15

Рассчитайте нижний и верхний квартили по данным, характеризующим коммерческие банки по срокам их функционирования (табл. 2.16).

Таблица 2.16

Распределение коммерческих банков по сроку функционирования (на начало года)

Группы банков по сроку функционирования, лет, x

Число банков, % к итогу, f

Накопленная частота, S

1

2

3

1-2

2-3

3-4

4-5

5-6

6-7

7-8

Свыше 8

10

15

21

25

12

7

5

5

10

25

46

71

83

90

95

100

Итого

100,0

-

Решение

Определим номер Q для 1-го и 3-го квартилей:

;

.

Применяя способ расчета, аналогичный расчету медианы по ряду накопленных частот, определим, что

3<Q1<4, т.е.года;

5<Q1<6, т.е.года.

Итак, 25% банков имеют срок функционирования менее 3 лет, 25% банков – свыше 3 лет, а остальные имеют срок функционирования в пределах от 3 до 5,3 года.

Децили (d1)– это значения вариант, которые делят ранжированный ряд на десять равных частей: 1-й дециль (d1) делит совокупность в соотношении 1/10 к 9/10, 2-й дециль (d2) – в соотношении 2/10 к 8/10 и т.д.

Вычисляются децили по той же схеме, что и медиана, и квартили:

; (2.20)

; (2.21)

………………………….

. (2.22)

Пример 2.16

Продолжим пример с распределением коммерческих банков по сроку функционирования (см. табл. 2.16). Рассчитаем 1-й и 9-й децили.

Определим номер для 1-го и 9-го децилей:

,

.

По ряду накопленных частот определяем, что

2<d1<3 т.е.года.

Это означает, что 10% коммерческих банков имеют срок функционирования менее 2 лет, а 90% банков имеют срок функционирования свыше 2 лет.

7<d9<8 т.е.года.

Это означает, что 90% банков имеют срок функционирования меньше 7 лет, а 10% банков имеют срок функционирования свыше 7 лет.

Показатели дифференциации. В тех случаях, когда при изучении вариационного ряда возникает необходимость дать относительную характеристику степени вариации ряда и имеются уже предварительно вычисленные квартили и децили, то можно рассчитать коэффициент дифференциации (Кд).

В зависимости от заданных ранговых показателей коэффициенты дифференциации рассчитываются по-разному.

1. Если заданы 3-я (Q3) и 1-я (Q1) квартили, то можно вычислить коэффициент дифференциации по формуле

. (2.23)

В большинстве случаев коэффициент вариации (V) составляет примерно 1,5 коэффициента дифференциации (Кд), т.е.

V=1,5KД. (2.24)

Пример 2.17

По данным табл. 2.16, характеризующим коммерческие банки по сроку функционирования, имеем:

года, года,Q1=3 года, Q3=5,3 года.

Отсюда

раза, или 27,7%;

V=0,2771*1,5=0,416*100=41,6%≈42%,

что и требовалось доказать.

2. Если сопоставляются 9-я (d9) и 1-я (d1) децили, то децильный коэффициент дифференциации Д) вычисляется по формуле

. (2.25)

Пример 2.18

По данным, представленным в табл. 2.16, d1=2 года;d9=7 лет; отсюдаКd=7/2=3,5 раза, т.е. минимальная величина срока функционирования 10% самых старых банков отличается от максимальной величины срока функционирования 10% самых молодых банков в 3,5 раза.

Рассмотренный выше показатель дифференциации не совсем точно измеряет уровень дифференциации, так как сопоставляется минимальная величина признака (25% или 10% самых крупных единиц совокупности) с максимальной величиной признака (25% или 10% самых мелких единиц совокупности).

3. Более точно уровень дифференциации можно измерить, сопоставив средние уровни, полученные из 10% наибольших и наименьших значений признака в совокупности. Такой показатель называется коэффициентом фондовой дифференциации (Кф):

, (2.26)

где – сумма значений признака 10% самых крупных единиц в совокупности;

n – число самых крупных и мелких единиц в совокупности;

–сумма значений признака 10% самых мелких единиц в совокупности.

Пример 2.19

Рассчитаем фондовый коэффициент. Имеются данные о размере капитала 20 коммерческих банков за год, млн руб.: 6,9; 9,3; 1,3; 6,0; 13,4; 3,7; 5,1; 2,9; 1,4; 1,6; 10,9; 7,2; 3,2; 8,9; 1,2; 8,2; 2,1; 8,1; 2,1; 11,5.

Так как 10% самых крупных и 10% самых мелких банков составляют одну и ту же величину (в нашем примере 1/10*20=2 ед.), то для расчета фондового коэффициента подставим в формулу (2.26) соответствующие значения и получим

раза.

Рассчитанный коэффициент показывает, что уровень дифференциации 20 коммерческих банков по размеру капитала достаточно высок; средний размер капитала 10% самых крупных банков в 9,96 раза превышает средний размер капитала 10% самых мелких банков.