- •Санкт-Петербург
- •Блок 2. Статистические наблюдения
- •Блок 3. Статистическая информация и статистические показатели
- •Блок 5. Статистические ряды распределения
- •Распределение группы туристов по числу заграничных туров, в которых они побывали
- •Свойства средней арифметической
- •Блок 7. Структурные средние
- •Блок 8. Показатели вариации
- •Блок 9. Изучение формы распределения
- •Ошибки выборочного наблюдения
- •Предельная ошибка выборки
- •Основные виды выборки
- •Блок 11. Малая выборка
- •Характеристики динамики
- •60 Человек на 1 января 2003 г. – это одновременно численность работников фирмы на 31 декабря 2002 г. Поэтому средняя численность работников:
- •Исследование тенденций развития явлений
- •Блок 13. Прогнозирование на основе изучения тренда
- •Агрегатные индексы
- •Блок 15. Индексы средних величин
- •Блок 17. Методы регрессионно-корреляционного анализа связи показателей
- •Критерии согласия
- •Основные формулы
- •Критические значения χ2
- •Перечень вопросов для подготовки к экзамену
- •Список литературы
Блок 8. Показатели вариации
Различие индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Колеблемость отдельных значений характеризуют показатели вариации. Различают вариацию признака случайную и систематическую. Анализ вариации позволяет оценить ее характер и определить насколько однородной является изучаемая совокупность и насколько характерной является ее средняя величина для данной совокупности.
Выделяют абсолютные и средние показатели вариации. Наиболее простой – размах вариации (R) – разность между наибольшим и наименьшим значением признака в распределении: R= .
Для получения обобщенной характеристики отклонений от средней рассчитывают среднее линейное отклонение для несгруппированных данных и для вариационного ряда показатель учитывается без знака этих отклонений.
На практике вариацию чаще оценивают с помощью показателя дисперсии в варианте без частот и
Если из дисперсии извлечь корень квадратный, то получится еще один показатель вариации – среднее квадратическое отклонение:
в варианте без частот и в варианте с частотами.
Коэффициент осцилляции характеризует относительную колеблемость крайних значений признака вокруг средней:
Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:
Наиболее распространенный показатель колеблемости, который дает обобщающую характеристику – коэффициент вариации:
Рассмотрим пример, где оценивается вариация стажа работы по специальности работников двух турфирм:
1-я 2-я
4
4
5
5
4 5
9 7
10 7
12 7
45 лет 45 лет
Проведем предварительные расчеты:
№ пп |
Стаж (лет)
|
|
|
Стаж
|
|
|
1 2 3 4 5 6 7 8 |
1 2 3 4 4 9 10 12 |
-4,6 -3,6 -2,6 -1,6 -1,6 3,4 4,4 6,4 |
21,16 12,96 6,76 2,56 2,56 11,56 19,36 40,96 |
4 4 5 5 6 7 7 7 |
-1,6 -1,6 -0,6 -0,6 0,4 1,4 1,4 1,4 |
2,56 2,56 0,36 0,36 0,16 1,96 1,96 1,96 |
|
45 |
- |
117,88 |
45 |
- |
11,88 |
Сопоставим показатели вариации стажа работников у двух турфирм.
1-я фирма 2-я фирма
При одинаковых средних величинах стажа работников фирм вариация признака в первой фирме в три раза выше, чем в первой.
Преобразование формулы среднего квадратического отклонения приводит ее к виду , что делает ее удобнее для практических расчетов. Этот показатель широко применяется для расчетов показателей вариации в различных отраслях знания и техники. Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются конкретные варианты от среднего их значения.
Дисперсия альтернативного признака характеризует вариацию альтернативных признаков. Альтернативными признаками являются признаки, которыми обладают одни единицы изучаемой совокупности и не обладают другие. Например, в фирме работают мужчины и женщины, доля мужчин (р) и доля женщин (q) образуют целый коллектив сотрудников фирмы: p +q = 1. Средняя величина для альтернативных признаков равна а дисперсия . Если на фирме работает 15 мужчин и 20 женщин, то р= а , следовательно дисперсия альтернативного признака Максимальное значение дисперсии альтернативного признака равно 0,25, оно получается при р=0,5.
Правило сложения дисперсий. Если совокупность варьирующих элементов подразделить на несколько групп, то можно выделить: общую дисперсию ( ), внутригрупповую дисперсию ( ), среднюю из внутригрупповых дисперсий ( ), межгрупповую дисперсию ( ).
Общая дисперсия характеризует колеблемость признака во всей изучаемой совокупности и рассчитывается по формуле:
, где - общая средняя для всей совокупности.
Внутригрупповая дисперсия характеризует колеблемость признака внутри группы и рассчитывается по формуле:
, где - групповая средняя.
Средняя из внутригрупповых характеризует внутригрупповую колеблемость вокруг внутригрупповых средних и рассчитывается как средняя величина из внутригрупповых дисперсий:
, где - дисперсии отдельных групп, а f - численность отдельных групп.
Межгрупповая дисперсия показывает вариацию групповых средних вокруг общей средней, измеряет вариацию изучаемого признака под влиянием признака - фактора (группировочного признака) и рассчитывается по формуле:
, где и - средние и численности по отдельным группам.
Между всеми приведенными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий – общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:
.
Логика этого правила следующая: общая дисперсия, возникающая под влиянием всех факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии возникающей за счет фактора группировки. Зная два вида дисперсий, всегда можно определить или проверить правильность расчета третьего вида дисперсии. Например, имеются данные по среднедневной выработке сотрудников фирмы с различным стажем работы:
Группы сотрудников по стажу |
Число сотрудников (f) |
Средняя дневная выработка (т. руб.)
|
Дисперсия выработки
|
До 5 лет |
40 |
120 |
450 |
Более 5 лет |
60 |
160 |
500 |
т. рублей
, следовательно: .
В статистике применяется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии, который показывает, какая часть общей вариации изучаемого признака обусловлена вариацией группировочного признака. Это коэффициент детерминации, рассчитываемый по формуле: .
Если извлечь корень квадратный из коэффициента детерминации, получаем новый показатель, который носит название корреляционное отношение:
.