Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СТАТИСТИКА (для студентов заочников) / Пособие по статистике (И.В.Шадрина)

.pdf
Скачиваний:
96
Добавлен:
04.06.2015
Размер:
1 Mб
Скачать

23

Т.е. для первого интервала до 25, нижняя граница интервала 25 - 5(величина второго интервала от 25 до 30) = 20, а, следовательно, середина первого интервала (20+25): 2 =22,5; для второго интервала середина будет определяться (25+30):2=27,5 и т.д. Для того чтобы рассчитать середину последнего открытого интервала 60 и более, определим верхнюю границу интервала для этого к нижней границе прибавим величину предпоследнего интервала 60+ (60-50) =70, середина последнего интервала (60+70):2=65.

Используя среднюю арифметическую взвешенную, определим средний возраст работников предприятия по формуле

x

x

ср

fi

 

22,5 * 7 27,5 * 33 35 * 75

45 * 38 55 *16 65 *1

37,3

года

fi

 

7 33 75

38

16 1

 

 

 

 

 

 

Свойства средней арифметической. Средняя арифметическая обладает некоторыми свойствами, которые позволяют упрощать вычисления, рассмотрим их.

1. Средняя арифметическая из постоянных чисел равна этому постоянному числу.

Если х = а. Тогда

x

af

 

f

a .

f

f

2. Если веса всех вариантов пропорционально изменить, т.е. увеличить или уменьшить в одно и то же число раз, то средняя арифметическая нового ряда от этого не изменится.

 

x

 

f

 

 

 

1

xf

 

xf

 

 

 

 

 

 

 

 

Если все веса f уменьшить в k раз, то x

 

 

 

k

 

k

 

 

.

 

 

 

 

 

f

 

 

 

f

 

 

1

f

 

 

 

 

k

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Сумма положительных и отрицательных отклонений отдельных вариантов от средней, умноженных на веса, равна нулю, т.е. x x f 0

Если x

xf

, то x f xf . Отсюда xf x f x x f 0 .

f

 

 

Если все варианты уменьшить или увеличить на какоелибо число, то средняя арифметическая нового ряда уменьшится или увеличится на столько же.

Уменьшим все варианты x на a, т.е. x´ = x a.

 

 

x a f

xf

 

a f

 

 

 

f

 

 

x a.

f

f

Тогда x

Среднюю арифметическую первоначального ряда можно получить, прибавляя к уменьшенной средней ранее вычтенное из вариантов числа a,

т.е. x x a .

5. Если все варианты уменьшить или увеличить в k раз, то средняя арифметическая нового ряда уменьшится или увеличится во столько же, т.е. в k раз.

 

 

 

 

 

 

 

 

 

 

24

 

 

 

 

 

 

 

 

f

x

 

 

 

1

xf

 

 

 

 

 

x

 

 

 

 

 

 

 

1

 

 

 

 

 

 

k

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

Пусть x

k , тогда x

 

f

 

 

f

k x .

Отсюда x x k , т.е. для получения средней первоначального ряда среднюю арифметическую нового ряда (с уменьшенными вариантами) надо увеличить в k раз.

Средняя гармоническая. Средняя гармоническая это величина обратная средней арифметической. Ее используют, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение (М= xf). Средняя гармоническая будет рассчитываться по формуле 3.5

xгарм

 

xf

 

M

(3.5)

f

 

M

 

 

 

 

 

x

 

Рассмотрим расчет средней гармонической на примере расчета средней цены на продукцию.

Средняя цена единицы продукции равна частному от деления суммы реализации от продажи продукции на количество реализованной продукции.

Пример. Найти среднюю цену на продукцию в трех городах, исходные данные приведены в табл. 3.8.

Таблица 3.8 Зависимость цены и суммы реализации в трех городах

Город

Цена за единицу (х),

Сумма реализации (М),

 

руб.

тыс.руб.

А

30

600

Б

20

1000

В

35

350

Итого:

 

1950

Рассчитаем среднюю цену на продукцию по формуле 3.5.

xгарм

M

 

 

M A M Б

M В

 

 

 

600 1000

350

 

1950

0,0243тыс.руб.

 

M

 

М А

 

М Б

 

М В

 

 

600

 

1000

 

350

 

80000

 

 

 

 

 

 

 

 

 

 

x

 

 

х А

хБ

хВ

 

 

 

0,030

0,020

0,035

 

 

 

Таким образом, средняя цена на продукцию по трем городам составила

0,0243 тыс.руб. или 24,3 руб.

Практическое применение средней гармонической – для расчета некоторых индексов, в частности, индекса цен.

Средняя геометрическая. При применении средней геометрической индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста.

xгеом f
П(xi ) fi
(3.6)
(3.7)

25

Средняя геометрическая величина используется также для определения равноудаленной величины от максимального и минимального значений признака. Например, страховая компания заключает договоры на оказание услуг автострахования. В зависимости конкретного страхового случая страховая выплата может колебаться от 10000 до 100000 долл. в год. Средняя сумма выплат по страховке составит 10000 *100000 31622,77 долл.

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии, когда z = 0. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел.

Формулы для расчета следующие

xгеом nП(xi ) – для невзвешенных значений,

– взвешенная,

где хi – варианты осредняемого признака; П – произведение вариантов;

f – частота вариантов.

Средняя геометрическая используется в расчетах среднегодовых темпов роста.

Средняя квадратическая. Формула средней квадратической используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения. Так, при расчете показателей вариации среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины.

Средняя квадратическая величина рассчитывается по формуле

 

x2

1

 

 

 

(3.8)

 

f

 

 

x2

f

 

2

 

 

x

f

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В экономических исследованиях средняя квадратическая в измененном виде широко используется при расчете показателей вариации признака, таких как дисперсия, среднее квадратическое отклонение.

Правило мажорантности. Между степенными средними существует следующая зависимость – чем больше показатель степени, тем больше значение средней, табл. 3.9:

 

 

 

 

Таблица 3.9

 

Соотношение между средними величинами

 

Значение z

–1

0

1

2

Соотношение

хгарм <

хгеом <

харифм <

хквадр < и т.д.

между средними

 

 

 

 

Это соотношение называется правилом мажорантности.

26

Структурные средние величины. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода, медиана, квартили и децили.

Мода. Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности. Модой называется то значение признака, которое соответствует максимальной точке теоретической кривой распределения.

Мода широко используется в коммерческой практике при изучении покупательского спроса (при определении размеров одежды и обуви, которые пользуются широким спросом), регистрации цен. Мод в совокупности может быть несколько.

Расчет моды в дискретном ряду. В дискретном ряду мода – это варианта с наибольшей частотой. Рассмотрим нахождение моды в дискретном ряду.

Пример. Имеются данные об опыте работы предпринимателей. Исходные данные представлены в табл.3.10.

Максимальная частота ( fmax 60 ), следовательно, мода будет равна 5

годам. То есть 60 % предпринимателей в сфере обслуживания населения имеют стаж работы 5 лет.

 

Таблица 3.10

Распределение предпринимателей по стажу

Стаж, лет

Число предпринимателей в сфере обслу-

 

живания населения, чел.

3

16

4

40

5

60

6

50

7

20

8

14

Итого:

200

Расчет моды в интервальном ряду. В интервальном вариационном ря-

ду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту (частость). В пределах интервала надо найти то значение признака, которое является модой. Для интервального ряда мода будет определяться формулой

 

Mo xMo hMo

fMo

fMo 1

 

 

(3.9)

 

fMo fMo 1

fMo fMo 1

 

 

 

где xM

– нижняя граница модального интервала; hM

– величина модального

 

o

 

 

 

o

интервала; f Mo – частота, соответствующая модальному интервалу; f Mo 1

27

частота, предшествующая модальному интервалу; f Mo 1 – частота интервала,

следующего за модальным.

Пример. Найти моду для стажа работников, т.е. средний стаж работы, который имеют максимальное количество работников, табл. 3.11:

Таблица 3.11

Распределение работников по стажу работы

Стаж работы (х), лет

 

 

Количество работников (f), чел.

 

До 3

 

 

 

 

 

10

 

3–5

 

 

 

 

 

48

 

5–7

 

 

 

 

 

28

 

7–9

 

 

 

 

 

10

более 9

 

 

 

 

 

4

Итого:

 

 

 

 

 

100

Вначале

найдем

модальный

интервал по максимальной частоте

( fmax 48), т.е. от 3 до 5. Затем по формуле 11 рассчитаем моду

 

M o

3 (5 3)

 

 

48 10

4,31 года

 

 

 

 

 

 

48

10 48 28

 

 

 

 

Медиана.

Медианой ( М е ) называется значение признака у средней

единицы ранжированного ряда. Ранжированный ряд – это ряд, у которого значения признака записаны в порядке возрастания или убывания. Или медиана это величина, которая делит численность упорядоченного вариационного ряда на две равные части: одна часть имеет значение варьирующего признака меньшие, чем средний вариант, а другая – большие.

Чтобы найти медиану, сначала определяется ее порядковый номер. Для этого при нечетном числе единиц к сумме всех частот прибавляется единица и все делится на два. При четном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер который определяется по общей сумме частот, деленной на два. Зная порядковый номер медианы, легко по накопленным частотам найти ее значение.

Расчет медианы в дискретном ряду. По данным выборочного обследо-

вания получены данные о распределении семей по числу детей, табл. 3.12. Для определения медианы сначала определим ее порядковый номер

= f

 

100

50

 

М е

2

2

 

 

 

Затем построим ряд накопленных частот ( f ) , по порядковому номеру и накопленной частоте найдем медиану. Накопленная частота 33 показывает, что в 33 семьях количество детей не превышает 1 ребенка, но так как номермедианы 50, то медиана будет находится в промежутке с 34 по 55 семью.

Таблица 3.12 Распределение числа семей от количества детей

28

Число детей в семье

Количество семей,

Накопленная частота

 

%

( f )

 

 

 

0

5

5

1

28

33

2

22

55

3

20

75

4

13

88

5

8

96

6 и более

4

100

Итого:

100

 

В этих семьях количество детей равно 2, следовательно, М е = 2. Таким

образом, в 50% семей число детей не превышает 2.

Расчет медианы в интервальном ряду. В интервальном вариационном ряду порядок нахождения медианы следующий: располагаем, индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты ( f ); по данным о накопленных частотах находится медианный интервал, а затем находим медиану по формуле

 

 

 

 

 

 

 

f

 

(3.10)

 

 

M e xM

 

hM

 

 

M e

M e 1

 

 

 

 

e

e

f M

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

 

 

где xM

–нижняя

граница медианного

интервала; hM

–величина медианного

 

e

 

 

 

 

 

 

 

 

e

 

 

интервала; f M e

–частота, соответствующая медианному интервалу;

 

fM e 1

частота накопленная, предшествующая медианному

интервалу;

М е

порядковый номер медианы.

Рассмотрим порядок расчета медианы в интервальном ряду.

Пример. Обеспеченность населения города общей жилой площадью характеризуется следующими данными, табл.3.13:

Таблица 3.13 Распределение семей от размера общей жилой площади

Размер общей жи-

До 10

10–12

12–14

14–16

 

 

16–18

18–20

Свыше

лой площади

на

 

 

 

 

 

 

 

 

 

 

 

20

одного члена семьи

 

 

 

 

 

 

 

 

 

 

 

 

(х), кв.м

 

 

 

 

 

 

 

 

 

 

 

 

 

Число семей (f), %

32

24

25

 

9

 

 

4

 

3

3

Накопленная

ча-

32

56

81

 

90

 

 

94

 

97

100

стота ( f )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Порядковый номер медианы равен

= f

 

100

50 .

 

 

 

 

 

 

 

 

М е

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

29

Определяем медианный интервал по накопленной частоте, он будет равен от 10 до 12. По формуле 3.10. находим медиану.

M e 10 (12 10) 50 32 11,5 кв.м 24

Полученный результат говорит о том, что 50 % семей в среднем на одного члена семьи имеют 11,5 кв.м. общей жилой площади.

Рассмотрим соотношение между средней, модой и медианой. а) х = Мо = Ме, то распределение симметрично.

б) Ме < х характерно при небольшой группе с большими числами.

в) х < Ме соответствует большой концентрации данных и не очень больших числах.

г) Мо < х , если совокупность неоднородна.

д) Мо > х , если совокупность небольшая и мода отчетливо выражена. Все рассмотренные формы степенной средней обладают важным свой-

ством (в отличие от структурных средних) – в формулу определения средней входят все значения ряда т.е. на размеры средней оказывают влияние значение каждого варианта.

С одной стороны, это весьма положительное свойство т.к. в этом случае учитывается действие всех причин, воздействующих на все единицы изучаемой совокупности. С другой стороны, даже одно наблюдение, попавшее в исходные данные случайно, может существенным образом исказить представление об уровне развития изучаемого признака в рассматриваемой совокупности (особенно в коротких рядах).

Квартили и децили. По аналогии с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Так, в частности, можно найти значение признака у единиц, делящих ряд на 4 равные части, на 10 и т.п.

Квартили. Варианты, которые делят ранжированный ряд на четыре равные части, называют квартилями.

При этом различают: нижний (или первый) квартиль (Q1) – значение признака у единицы ранжированного ряда, делящей совокупность в соотношении ¼ к ¾ и верхний (или третий) квартиль(Q3) – значение признака у единицы ранжированного ряда, делящий совокупность в соотношении ¾ к ¼.

Второй квартиль, есть медиана Q2 = Ме. Нижний и верхний квартили в интервальном ряду рассчитываются по формуле аналогично медиане.

 

 

 

 

1

 

 

f

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

(3.11)

Для нижнего квартиля Q1

xQ

hQ

 

 

 

 

Q1 1

.

 

 

 

 

 

 

 

 

fQ

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

3

 

 

f

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

1

 

(3.12)

Для верхнего квартиля Q3

xQ

hQ

 

 

 

 

Q3

.

 

 

 

 

 

 

fQ

 

 

 

 

 

 

3

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

fQ1 ; fQ3

30

где хQ1 ; xQ3 – нижняя граница интервала, содержащего соответственно нижний и верхний квартиль;

f

1

; f

3

– накопленная частота интервала, предшествующего интерва-

Q1

Q3

 

лу, содержащему нижний или верхний квартиль;

– частоты квартильных интервалов (нижнего и верхнего)

Интервалы, в которых содержатся Q1 и Q3 определяют по накопленным частотам (или частостям).

Пример. Определить нижний и верхний квартили, исходные данные даны в табл. 3.14:

Таблица 3.14 Распределение предприятий по объему продаж

Продажа продукции (х),

Число предприятий (f)

 

Накопленная частота (f' )

млн. руб.

 

 

 

 

 

 

 

 

До 50

 

 

 

 

 

3

 

3

50–100

 

 

 

 

 

6

 

9

100–150

 

 

 

 

 

10

 

19

150–200

 

 

 

 

 

21

 

40

200–250

 

 

 

 

 

33

 

73

250–300

 

 

 

 

 

18

 

91

более 300

 

 

 

 

 

9

 

100

Найдем номер нижнего и верхнего квартиля:

 

Q1

1

 

f

 

1

 

100 25 для нижнего квартиля,

т.е. квартильный интер-

 

 

 

 

4

 

 

 

4

 

 

 

 

 

вал для нижнего квартиля от 150-200.

 

Q3

3

f

 

 

3

100 75 для верхнего квартиля,

т.е. квартильный интер-

 

 

4

 

 

4

 

 

 

 

вал для верхнего квартиля от 250-300.

Рассчитаем нижний квартиль по формуле 13

Q1 150 50 25 19 164,3 млн.руб., это означает, что у ¼ всех предприя-

21

тий продажа продукции не превышает 164,3 млн.руб. Рассчитаем верхний квартиль

Q3 250 50 75 73 255,5 млн.руб. 18

а у 3 4 предприятий реализация продукции не превышает 255,5 млн.руб.

Децили. Кроме квартилей рассчитывают децили – варианты, делящие ранжированный ряд на 10 равных частей.

Обозначаются они через D, первый дециль D1 делит ряд в соотношении 1/10 и 9/10, второй D2 – 2/10 и 8/10 и т.д. Вычисляются они по той же схеме, что и медиана и квартили.

 

 

 

 

 

 

 

 

 

 

 

31

 

 

 

 

 

 

 

 

1

 

 

 

f

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

1

 

(3.13)

D1 xD

hD

 

D1

первый дециль.

 

 

 

 

 

f D

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

2

 

 

 

f

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

1

 

 

(3.14)

D2 xD

hD

 

 

D2

второй дециль и т.д.

 

 

 

 

 

f D

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

И медиана, и квартили, и децили принадлежат к так называемым порядковым статистикам, под которым понимают вариант, занимающий определенное порядковое место в ранжированном ряду.

ТЕМА 4. ПОКАЗАТЕЛИ ВАРИАЦИИ Показатели вариации. При изучении варьирующего признака у еди-

ниц совокупности нельзя ограничиваться лишь расчетом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям.

Вариацией признака называется различие индивидуальных значений признака внутри изучаемой совокупности.

Термин «вариация» произошел от латинского variatio – изменение, колеблемость, различие. Однако не всякие различия принято называть вариацией.

Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Колеблемость отдельных значений характеризуют показатели вариации. Чем больше вариация, тем дальше в среднем отдельные значения лежат друг от друга.

Различают вариацию признака в абсолютных и относительных величи-

нах.

Кабсолютным показателям относятся: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия. Все абсолютные показатели имеют ту же размерность, что и изучаемые величины.

Котносительным показателям относятся коэффициенты осцилляции, вариации.

Рассмотрим расчет показателей на примере двух совокупностей.

1 совокупность

2 совокупность

n = 5

n = 8

80, 100, 120, 200, 300

145, 150, 155, 160, 160, 162, 168, 180

Рассчитаем среднюю величину для первой и второй совокупностей.

x1

x

 

80 100 120 200 300

160

n

5

 

 

 

 

 

 

32

 

 

x2

xf

 

145 150 155 160 * 2 162 168 180

160

f

1 1 1 2 1 1

1

 

 

 

Показатели абсолютные. Рассчитаем абсолютные показатели, характеризующие вариацию признака.

Размах вариации, представляет собой разность между максимальным и

минимальным значением признака.

 

R = Xmax – Xmin.

(4.1)

Для первой совокупности R1 = 300–80=220, для второй совокупности

R2=180–145=35.

Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц.

Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической.

Таких показателей в статистике два: среднее линейное и среднее квадратическое отклонение.

Среднее линейное отклонение (L) представляет собой среднее арифметическое из абсолютных значений отклонений отдельных вариантов от сред-

ней.

 

 

 

 

 

 

 

 

 

 

L

 

x x

 

 

– для несгруппированных данных;

(4.2)

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

L

 

x x

 

f

– для сгруппированных данных.

(4.3)

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

Практическое использование среднего линейного отклонения заключается в следующем, с помощью этого показателя анализируется состав работающих, ритмичность производства, равномерность поставок материалов.

Недостаток этого показателя заключается в том, что он усложняет расчеты вероятного типа, затрудняет применение методов математической статистики.

Для первой совокупности:

L

| 80 160 | |100 160 | |120 160 | | 200 160 | | 300 160 |

72

 

 

 

1

5

 

.

 

 

Для второй совокупности:

L

| 145 160 | | 150 160 | | 155 160 | | 160 160 | 2 | 162 160 | | 168 160 | | 180 160 |

7 .

 

2

8

 

 

 

Среднее квадратическое отклонение ( ) является наиболее распространенным и общепринятым показателем вариации. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними

=1,25L

(4.4)