Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

statist

.pdf
Скачиваний:
48
Добавлен:
17.05.2015
Размер:
1.55 Mб
Скачать

5.СРЕДНИЕ ВЕЛИЧИНЫ

5.1Понятие средних величин, их виды и способы расчета степенных

средних

Для изучения закономерностей развития социально-экономических

явлений

в статистике используют средние величины. Широкое применение

средних

величин обусловлено их незаменимостью в анализе явлени

общественной

жизни.

Так,

одна

из

 

задач

органов

статистики–

характеристика

уровня

жизни

населения

в

целом, в

частности –

изучение

уровня

его

доходов

по

разным

социальным . Сгравнениеуппам

индивидуальных

доходов каждой семьи

рабочего, служащего невозможно.

Не представляет интереса и сравнение суммарных доходов отдельных

социальных

групп, так

как эти

группы

неодинаковы

по численности

(например,

численность

рабочих

и

численность,

занятыхлиц

в

предпринимательстве). В связи с этим при анализе лучше использовать средние величины, а именно среднюю величину доходов на одного человека

или на одну семью по каждой группе.

 

 

Средняя

величина – обобщающий

показатель, который

дает

количественную характеристику признака в статистической совокупности в

условиях конкретного места и времени.

 

 

Для того чтобы средняя величина была действительно типичной для

изучаемой совокупности и давала количественную характеристику признака,

 

ее необходимо исчислять с учетом ряда

условий. В

качестве

основных

условий правильного применения средней величины выделяют следующие.

 

1)

Средняя величина должна определяться лишь для совокупностей,

состоящих из однородных единиц.

 

 

 

 

 

 

 

2)

Совокупность,

неоднородную

в

качественном

отношении,

необходимо

разделять

на

однородные

группы

и

вычислять

для

групповые, типичные средние, характеризующие каждую из этих групп. В

 

этом проявляется связь между методами группировок и средних величин.

 

3)

Средняя

величина

сглаживает

индивидуальные

значения и

тем

самым

может

элиминировать

разные

тенденциив

развитии, скрыть

 

передовое и отстающее. Поэтому кроме средней величины нужно исчислять

другие показатели.

 

 

 

 

 

 

 

 

 

 

4)

Среднюю величину целесообразно рассчитыватьне для отдельных

единичных фактов, взятых изолированно друг от друга, а для совокупности

 

фактов.

 

 

 

 

 

 

 

 

 

 

 

 

Средние величины подразделяются надве основные категориив

 

зависимости

от

поставленной

цели

исследования, вида

и

взаимосвязи

изучаемых признаков. Выделяют степенные и структурные средние.

41

Средняя степенная простая:

Х = k åХ к ¸ n ,

где (Х) – значения признака, для которого исчисляется средняя величина (они являются варьирующими, осредняемыми). Единицы варьирующего признака, принимающие определенное числовое выражение, есть варианта (вариант);

n – количество вариант в исследуемой совокупности (число единиц); к – показатель степени.

Формула простой средней применяется в случае, если каждая варианта Х встречается в совокупности один или одинаковое число раз.

Средняя степенная взвешенная:

Х = k åX k ´ fi ¸ å fi ,

где fi – показатель повторяемости вариант в исследуемой совокупности (веса, частоты).

Формула взвешенной степенной средней применяется в случае, сли каждая варианта Х встречается в совокупности не одинаковое число раз, т. е. по сгруппированным данным.

Различают несколько видов степенных средних в зависимости от

показателя степени (к).

 

 

 

 

Показатель

степени (к) принадлежит

множеству [-1; +∞),

поэтому

выделяют следующие виды степенных средних.

 

 

Средняя гармоническая к = -1.

 

 

 

Средняя

гармоническая

применяется

в ,случаеесли

известны

варьирующие обратные значения признака или сводные величины.

 

Средняя геометрическая к = 0.

 

 

 

Наиболее

широко

средняя

геометрическая

применяется

определения средних темпов изменения в рядах динамики, а также в рядах распределения.

Средняя арифметическая к = 1.

Средняя арифметическая применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумм значений признака отдельных ее единиц.

При расчете средней арифметической в интервальном ряду необходимо перейти от интервального ряда к дискретному ряду путем определения середины интервала с использованием арифметической простой средней.

Средняя квадратическая к = 2.

42

Средняя кубическая к = 3.

Средние квадратическую, кубическую и другие используют для оценки меры вариации индивидуальных значений признака вокруг сред арифметической в рядах распределения.

Для одной и той же совокупности имеют место строго определенные соотношения между разными видами степенных средних. Эти соотношения называют правилом мажорантности средних, которое гласит, что средняя величина, рассчитанная по формуле средней более высокой степени, всегда больше или равна средней величине, рассчитанной по формуле меньшей степени:

Х гармоническая £ Х геометрическая £ Х арифметическая £ Х квадратическая £и т.д.

Наиболее распространенный вид средних величин– средняя арифметическая, которая обладает рядом математических свойств. Они более полно раскрывают ее сущность и в некоторых случаях используются для упрощения ее расчета.

1) Произведение средней на сумму частот всегда равно сум произведений вариант на частоты:

Х´ å f i= åX i ´ fi .

2)Если от каждой варианты отнять какое-нибудь произвольное число, то новая средняя уменьшится на то же число:

å( Х i - A) ´ fi ¸ å fi = X - A .

3) Если к каждой варианте прибавить какое-нибудь произвольное число, то средняя увеличится на это же число:

å( X i + A) ´ fi ¸ å fi = X + A .

4)Если каждую варианту разделить на какое-нибудь произвольное число, то средняя арифметическая уменьшится во столько же раз:

åX i ¸ A ´ fi ¸ å fi = X ¸ А .

5)Если каждую варианту умножить на какое-нибудь произвольное число, то средняя арифметическая увеличится во столько же раз:

å(X i ´ A) ´ fi ¸ å fi = X + А .

43

6)Если все частоты(веса) разделить или умножить на какое-нибудь число, то средняя арифметическая от этого не изменится:

åX i ´ ( fi ´ A) ¸ å( fi ´ A) = X .

7)Сумма отклонений вариант от средней арифметической всегда равна

нулю:

å( Х - Х ) ´ fi = 0 .

5.2 Структурные средние величины, их смысл и значение

Важный вид средних величин– структурные (непараметрические) средние. Их используют для изучения внутреннего строения и структуры рядов распределения значений признака.

К основным видам структурных средних относят:

-моду;

-медиану;

-квартили;

-децили;

-квинтили;

-перцентили.

Мода – величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном дискретном ряду модой выступает варианта, имеющая наибольшую частоту.

Мода (Мо) в интервальных рядах с равными интервалами вычисляется по формуле:

М о = Х м

+ iм ´

 

( f

м

- f м

-1 )

,

 

 

 

о

о

 

 

 

 

 

 

 

 

 

о

о

( f

м - f

м

-1 ) + ( f

м - f м +1 )

 

 

 

 

 

 

 

 

 

 

 

 

о

о

 

 

о

о

где Хмо – минимальная граница модального интервала; iмо – величина модального интервала;

fмо – частота модального интервала;

fмо-1 – частота интервала предшествующего модальному интервалу; fмо+1 – частота интервала, следующего за модальным.

Модальный

интервал

в

интервальном

ряду

определяется

наибольшей частоте.

 

 

 

 

Медиана

варианта, которая

находится в середине

вариационного

ряда. Медиана делит ряд пополам, по обе стороны от нее(вверх и вниз) находится одинаковое количество единиц совокупности.

44

Медиана в зависимости от вида вариационного ряда определяется

следующим образом.

 

 

 

 

1) В

дискретном

вариационном

ряду

определение

медианно

значения признака сводится к определению номера медианной единицы ряда (Nме) по формуле:

Nме = (n – 1) : 2,

где n – объем совокупности.

Полученное

значение

показывает, где

точно

находится

номер

медианной

единицы (номер

середины

ряда). Медианное

значение

характеризуется тем, что его кумулятивная частота(сумма накопленных частот по группам) равна половине суммы всех частот или превышает ее.

2) В интервальном ряду с равными интервалами медиана(М ) рассчитывается по формуле:

М е = Х м

+ iм

´

0,5å f - S ме -1

,

 

е

 

е

f м

 

 

 

 

 

 

е

где Хме – начальное значение медианного интервала; iме – величина медианного интервала;

Sf – сумма частот ряда;

Sме-1 – сумма накопленных частот в интервалах, предшествующих медианному;

fме – частота медианного интервала.

Для определения медианного интервала необходимо рассчитать суммы накопленных частот. Медианный интервал характерен тем, что кумулятивная частота равна или превышает половину суммы всех частот ряда.

3) В ранжированных рядах несгруппированных данных медиана равна

значению

признака,

расположенного строго в середине ряда. В случае

четного объема ряда медиана равна средней из двух вариант, находящихся в

середине ряда.

 

 

 

 

 

Квартили

значения

признака,

делящие

ранжированную

совокупность

на

четыре равные части. Различают нижний квартиль,

отделяющий j-ю часть совокупности с наименьшими значениями признака, и

верхний

квартиль,

отсекающий j-ю

часть

с наибольшими значениями

признака. Средний квартиль совпадает с медианой.

Децили – варианты, делящие ранжированный ряд на 10 равных частей. Квинтили – значения признака, делящие ряд на пять равных частей. Перцили – значения признака, делящие ряд на 100 равных частей.

45

6.СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВАРИАЦИИ

6.1Понятие вариации и показатели ее размера

Любая статистическая совокупность состоит из единиц, значения признака которых варьируют. Для того чтобы судить об однородности совокупности и типичности средней величины изучаемого признака, анализ следует дополнять изучением вариации признака и исчислением показателей

вариации.

 

 

 

 

 

 

Вариация – колеблемость, многообразие, изменяемость

величины

признака у отдельных единиц совокупности.

 

 

 

Для

характеристики

меры

вариации

признака

в

совокупно

используют ряд показателей.

Абсолютные показатели:

-размах вариации;

-среднее линейное отклонение;

-дисперсия;

-среднее квадратическое отклонение.

Относительные показатели:

-линейный коэффициент вариации;

-коэффициент осцилляции;

-коэффициент вариации.

Размах вариации (R) характеризует границы вариации изучаемого признака и определяется по формуле:

R = Xmax – Xmin,

где Xmax – максимальное значение варьирующего признака; Xmin – минимальное значение варьирующего признака.

Размах вариации показывает, сколь велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. Он основан на крайних значениях варьирующего признака и не отражает отклонений всех вариант в ряду.

Среднее линейное отклонение(d) показывает, на какую величину

отклоняется признак

в изучаемой

совокупности от средней величин

признака, и определяется по следующим формулам:

 

å

 

X -

 

 

å

 

X -

 

 

 

´ f

 

 

X

 

 

X

 

d =

 

 

 

 

или d =

 

 

 

 

.

 

 

 

 

 

 

 

 

 

n

 

 

å f

Этот показатель учитывает только положительные отклонения.

46

Дисперсия (s2) представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по следующим формулам:

s

2

=

å( X -

X

)2

или s

2

=

å(X -

X

)2 ´ f

 

n

 

,

 

 

 

 

 

 

å f

где Х – индивидуальные значения варьирующего признака (варианты); Х – среднее значение варьирующего признака;

n – количество разновидностей вариант;

f – показатель повторяемости вариант (частоты, веса).

Среднее квадратическое отклонение(s) представляет собой обобщающую характеристику размеров вариации признака в совокупности и определяется по следующим формулам:

 

 

 

 

å(X -

X

)2

å( X -

X

)2 ´ f

.

s = s

2

=

 

n

 

или s =

å f

 

 

 

 

 

 

 

Среднее квадратическое отклонение показывает, на какую величину в

среднем значение

 

признака

 

отличается

от стандартного значения,

выражается в тех же единицах измерения, что и признак.

 

Формулы простых абсолютных показателей вариации применяются в случае, если каждая варианта(Х) встречается в совокупности один или одинаковое число раз.

Формулы взвешенных абсолютных показателей вариации применяются в случае, если каждая варианта(Х) встречается в совокупности не одинаковое число раз, т. е. по сгруппированным данным.

Линейный коэффициент вариации (Vd) определяется по следующим формулам:

Vd = d ´100% .

X

Коэффициент осцилляции (Vr) исчисляется по формуле:

Vr = R ´100% .

X

Коэффициент вариации (V) применяется для характеристики меры вариации значений признака вокруг средней величины:

47

V= s ´100% .

X

Чем этот показатель меньше, тем однороднее совокупность, а средняя величина признака типична для совокупности. Чем коэффициент вариации больше, тем неоднороднее совокупность.

Техника вычисления дисперсии может быть ,упрощенаесли использовать ряд ее математических свойств.

Основные математические свойства дисперсии следующие.

1)Если из всех значений вариант вычесть какое-нибудь постоянное число А, то средний квадрат отклонений от этого не изменится.

2)Если все значения вариант разделить на какое-нибудь постоянное число А, то средний квадрат отклонений уменьшится от этого в2 разА, а среднее квадратическое отклонение – в А раз.

3)Если рассчитать средний квадрат отклонений от любой величины (А), в той или иной степени отличающейся от средней арифметической( Х ), то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической.

4)Свойство минимальности дисперсии заключается в, чтом дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин.

6.2 Дисперсия альтернативного признака

Среди множества признаков, изучаемых статистикой, выделяют такие, которыми обладают одни единицы совокупности и не обладают другие.

Альтернативный признак – это признак, которым обладают одни единицы и не обладают другие единицы совокупности. Он, как правило, бывает только качественным.

Вариация альтернативного признака количественно проявляется в значении нуля у единиц, которые этим признаком не обладают, или единицы у тех, которые данный признак имеют.

Для количественно оценки вариации альтернативного признак исчисляют два показателя:

-среднее значение альтернативного признака;

-дисперсия альтернативного признака.

48

Среднее

значение

альтернативного

признакаопределяют

по

формуле:

 

 

 

 

 

 

 

 

 

= (1´ р + 0 ´ q) ¸ ( р + q) = р ,

 

 

 

Х

 

 

где р – доля

единиц, обладающих признаком, в численности

всей

совокупности;

 

 

 

q – доля единиц совокупности, не обладающих этим признаком (q=1-p).

 

Дисперсия

 

 

 

альтернативного

признакасоответственно

рассчитывается по формуле:

s 2 = (1 - р)2 ´ р + (0 - р)2 ´ q = q 2 ´ p + p 2 ´ q = p ´ q . p + q

Числовые значения дисперсии альтернативного признака находятся в интервале (0; 0,25].

 

6.3 Закон сложения (разложения) вариации

(дисперсии)

Вариация

признака

обусловлена

разными

факторами. Выделить

влияние

некоторых

факторов

можно, если

разбить

статистическую

совокупность на группы. Это дает возможность изучить вариацию признака

по всей

совокупности,

а

также

вариацию

для

каждой

группы и между

группами. Такое изучение вариации достигается посредством вычисления и анализа разных видов дисперсий.

Закон сложения (разложения) дисперсий выражается следующим равенством:

s 2 = d 2 +s i2 .

Общая дисперсия (s2) характеризует вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

Межгрупповая дисперсия (d2) характеризует вариацию изучаемого признака под влиянием признака-фактора, положенного в основание группировки:

d2 = å( Х i - X ) ´ f .

åfi

49

Средняя из внутригрупповых дисперсий(si ) отражает случайную вариацию, обусловленную неучтенными факторами и не зависящую от признака-фактора, положенного в основание группировки:

si2 = åsi2 ´ fi ;

åfi

si2 = å( X i - X i ) ´ fi - внутригрупповая дисперсия.

åfi

6.4Коэффициент детерминации, эмпирическое корреляционное

отношение

Различные виды дисперсий широко используют для исчислени показателей тесноты связи между признаками:

- эмпирического корреляционного отношения; - коэффициента детерминации.

Эмпирическое корреляционное отношениехарактеризует влияние

признака, положенного в основание группировки,

определяется по

формуле:

 

h =

 

.

 

d 2 ¸s 2

 

Если h=0, то группировочный признак не оказывает влияния на результативный.

Если h=1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих

факторных признаков равно нулю.

 

 

 

Эмпирическое корреляционное отношение изменяется в пределах [0, 1]

и

может

быть

только

положительным. Качественная

интерпретация

показателя осуществляется посредством шкалы Чэддока.

 

 

Шкала значений эмпирического корреляционного отношения:

-связь очень слабая– значение эмпирического корреляционного отношения находится в пределах 0,1 – 0,3;

-умеренная – значение эмпирического корреляционного отношения находится в пределах 0,3 – 0,5;

-заметная – значение эмпирического корреляционного отношения находится в пределах 0,5 – 0,7;

-тесная – значение эмпирического корреляционного отношения находится в пределах 0,7 – 0,9;

50

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]