Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Общая теория статистика-Практикум-2001.doc
Скачиваний:
56
Добавлен:
29.10.2018
Размер:
2.49 Mб
Скачать

Виды и формы средних величин

Формы

Простая

фор-мулы

Взвешенная

фор-мулы

Виды

1. Арифме­тическая

(2.1)

(2.2)

2. Гармони­ческая

(2.3)

(2.4)

3. Квадра­тическая

(2.5)

(2.6)

4. Геомет­рическая

(2.7)

(2.8)

5. Хроноло­гическая

(2.9)

где - среднее значение признака;

хi - индивидуальные значения осредняемого признака;

n - количество единиц совокупности;

fi - частота (вес) индивидуальных значений осредняемого признака;

wi = xifi - произведение индивидуального значения признака и его частоты.

Выбор формы средней зависит от того, в каком виде представлены данные: если они сгруппированы, т.е. одно и то же значение признака встречается несколько раз, используются взвешенные средние. Если каждое значение признака встречается только один раз, средняя рассчитывается в простой форме.

Выбор вида средней зависит от вида осредняемого признака и от наличия исходных данных.

Чаще всего используется простая или взвешенная арифметическая средняя.

В том случае, когда нет данных о частотах отдельных признаков, но имеются сведения о произведении индивидуального значения признака на его частоту, среднюю арифметическую можно заменить средней гармонической. При этом гармоническая простая используется только тогда, когда равны объемы совокупностей.

Средняя квадратическая, простая и взвешенная, используется, как правило, для расчета средних отклонений.

Геометрическая средняя используется для осреднения таких признаков, для которых характерна мультипликативная зависимость. Чаще всего гармоническая средняя используется для расчета средних темпов роста и средних индексов.

Хронологическая средняя применяется для расчетов средних уровней в моментных рядах динамики.

Помимо средних величин, в статистическом анализе используются и структурные средние: мода и медиана.

Мода - это значение признака, которое чаще всего встречается в ряде распределения. В дискретных рядах модой является значение признака в той группе, у которой наблюдается наибольшая частота. Определить моду в этом случае можно визуально.

В интервальных рядах распределения мода также находится в той группе, у которой наибольшая частота. Но так как в интервальных рядах признак может принимать любое значение в заданном интервале, точное значение моды следует определять по специальной формуле:

(2.10)

где хмо - нижняя граница модального интервала;

iмо - величина модального интервала;

fмо - частота модального интервала;

f(мо-1) - частота интервала, предшествующего модальному;

f(мо+1) - частота интервала, следующего за модальным.

Модальным является интервал, имеющий наибольшую частоту

Значение моды, рассчитанное по формуле (2.10), не может быть меньшим, чем нижняя граница модального интервала, и не будет превышать верхнюю границу модального интервала.

Медиана - это значение признака, стоящего в центре ранжированного ряда распределения. В дискретном ряде распределения медиана равна значению признака в той группе, у которой сумма накопленных частот равна или превышает половину суммы всех частот ряда распределения.

Сумма накопленных частот находится последовательным сложением частот каждой группы. Так, для первой группы сумма накопленных частот будет равна частоте этой группы, для второй группы - сумме частот первой и второй группы, для третьей группы - сумме частот первой, второй и третьей группы и т.д. накопленная частота последней группы будет равна общей сумме частот ряда распределения.

В интервальном ряде распределения медиана находится по специальной формуле:

(2.11)

где хме - нижняя граница медианного интервала;

iме - величина медианного интервала;

fме - частота медианного интервала;

Σf - сумма всех частот ряда распределения;

Sме-1 - сумма частот, накопленных до медианного интервала.

Медианным считается интервал, сумма накопленных частот которого равна или превышает половину всех частот ряда распределения

Значение медианы будет не меньше, чем значение нижней границы медианного интервала, и не превысит значения верхней границы медианного интервала.

По соотношению моды, медианы и средней можно судить о характере распределения признака. Распределение может быть симметричным. В этом случае наблюдается равенство между модой, медианой и средним значением признака (рис. 2.1).

частота признака, (fi)

у

значение признака (хi)

х

Рис. 2.1. Симметричный ряд распределения

В реальной жизни симметричное распределение встречается нечасто, поэтому чаще следует определять характер асимметрии. Если между модой, медианой и средней выполняется соотношение (2.12), то мы имеем дело с правосторонней асимметрией.

Мо < Ме < . (2.12)

частота признака, (fi)

у

значение признака (хi)

х

Рис. 2.2. Ряд распределения с правосторонней асимметрией

При наличии левосторонней асимметрии мода, медиана и средняя связаны следующим образом:

Мо > Ме > . (2.13)

Определить наличие асимметрии можно и с помощью относительного показателя - коэффициента асимметрии. Он может быть рассчитан в двух вариантах - на основе моды или медианы.

, (2.14)

. (2.15)

Если As > 0, имеется правосторонняя асимметрия, если As < 0 - левосторонняя.

частота признака, (fi)

у

значение признака (хi)

х

Рис. 2.3. Ряд распределения с левосторонней асимметрией

Показатели вариации характеризуют степень отклонения реальных значений признака от среднего значения и друг от друга. Они делятся на три группы: абсолютные, средние и показатели относительного рассеивания.

К абсолютным показателям вариации относится размах вариации, который характеризует отклонение крайних значений признака.

(2.16)

где xmax, xmin - максимальное и минимальное значение признака в изучаемой совокупности.

К средним показателям вариации относятся среднее линейное отклонение, среднее квадратическое отклонение и дисперсия. Эти показатели существуют в двух формах: простой и взвешенной.

Простая форма применяется для несгруппированных данных, взвешенная - если данные сгруппированы. Форма расчета средних показателей вариации совпадает с формой расчета средней величины.

Среднее линейное отклонение находится как отношение суммы отклонений индивидуальных значений признаков от средней (взятой по модулю) к количеству единиц совокупности (формулы (2.17) и (2.18). Среднее линейное отклонение показывает, на сколько единиц в среднем индивидуальные значения признака отклоняются от его среднего значения.

, (2.17)

. (2.18)

Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько единиц в среднем индивидуальные значения признака отклоняются от средней, но сумма отклонений возводится в квадрат. Рассчитывается также в простой и взвешенной форме.

, (2.19)

. (2.20)

Дисперсия представляет собой сумму квадратов отклонений индивидуальных значений признака от средней. Данный показатель не имеет единиц измерения. В простой форме дисперсия имеет вид:

(2.21)

Во взвешенной форме:

. (2.22)

Можно рассчитать дисперсию по методу моментов. В этом случае расчет производится по формуле:

(2.23)

Показатели относительного рассеивания являются мерой вариации признака и позволяют сопоставлять степень вариации у различных совокупностей. Данные показатели находятся как отношение абсолютных или средних показателей вариации к среднему значению признака.

Коэффициент осцилляции рассчитывается как отношение размаха вариации к среднему значению признака (в процентах):

(2.24)

Относительное линейное отклонение находится как частное от деления среднего линейного отклонения на среднее значение признака ( в процентах):

(2.25)

Коэффициент вариации является мерой типичности средней и находится по формуле:

(2.26)

Если значение коэффициента вариации не превышает 30%, средняя считается типичной для совокупности и ее можно применять в экономических расчетах.

Для графического изображения рядов распределения используются специальные графики: полигон распределения и гистограмма.

Полигон распределения применяется для изображения дискретных рядов распределения. Дискретные ряды распределения характеризуются тем, что значение признака у них задано конкретным прерывным числом. Поэтому для построения полигона распределения на оси абсцисс откладываются значения признака, на оси ординат - частоты признака. Отложенные точки соединяются прямыми линиями. Таким образом, полигон распределения представляет собой разновидность линейной диаграммы (рис. 2.4).

частота признака, fi

у

значения признака, х

Рис. 2.4. Полигон распределения

При наличии интервального ряда распределения, значения признака в котором заданы не конкретным числом, а могут принимать любые величины в заданном интервале, используется особый вид столбиковой диаграммы - гистограмма.

Для построения гистограммы на оси абсцисс откладываются интервалы, в которых находится значение признака, а на оси ординат - частоты. Схематичное изображение гистограммы распределения приведено на рис. 2.5. Интервальный ряд распределения может быть изображен и полигоном распределения. Для этого в качестве конкретных значений признака используются середины интервалов.

частота признака, fi

у

значения признака, хi х

Рис. 2.5. Гистограмма распределения