Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Астаховстатистика.doc
Скачиваний:
13
Добавлен:
05.02.2016
Размер:
4.2 Mб
Скачать

Тема 13

Обобщающие показатели вариации

После изучения этой темы вы сможете:

обосновать показатели вариации, их значение, содержание и методику расчета;

раскрыть значение и дисперсии, правило их сложения;

иметь представление о законах вариации и распределения;

провести сравнительную оценку эмпирического и нормального рас­пределений на предмет их близости и характера расхождений.

Итак, мы познакомились с вариационными рядами распределения. Такие ряды показывают вариацию изучаемых явлений по определенному признаку, однако они не дают обобщающей ее характеристики. Обобщающими показателями являются средние величины, но они нивелируют индивидуальные значения варьирующего признака и различия между ними. А именно они часто и представляют большой интерес с точки зрения наиболее полного раскрытия структуры и общего анализа изучаемой совокупности. Обобщающие показатели вариации разработаны, они могут быть подсчитаны и по вариационному ряду, и по первичному ряду - непосредственно по конкретным исходным данным или ранжированному ряду.

Рекомендуется пять таких обобщающих показателей: размах вариации (R), среднее линейное, или абсолютное, отклонение (L), среднее квадратическое отклонение (),коэффициент вариации (V), дисперсия (), ассиметрия (AS), эксцесс (EX).

Важное значение этих показателей можно свести к тому, что они:

1. дополняют средние величины, за которыми скрываются индивидуальные различия;

2. характеризуют степень однородности статистической совокупности по взятому признаку;

3. определяют границы вариации признака;

4. характеризуют взаимосвязь между признаками.

Размах вариации - абсолютная величина разности между максимальным и минимальным значениями (вариантами) взятого признака:

Он характеризует пределы изменения варьирующего признака и всецело зависит от колебаний только двух крайних вариантов. Он совершенно не связан с частотами в вариационном ряду, т.е. с характером распределения, что может придать ему неустойчивый, случайный характер, тем не менее, размах вариации может сказать о многом, любое явление имеет свои пределы варьирования, максимальные значения - человек в 3 метра ростом, собака в 150 кг. или предприятие с доходом 0, 5 руб. в год говорят скорее всего об элементарной ошибке или о ненормальности явления.

3Адание:

Что бы вы предложили для более надежной характеристики размаха вариации? Приведите расчетный пример.

Более надежным показателем здесь может быть средний размах, исчисленный как средняя арифметическая из ряда размахов, полученных в результате равных серий наблюдений.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической, при этом разности берутся по модулю, т.е. без учета знаков. Формулы следующие:

а) для первичного ряда б) для вариационного ряда

Этот показатель уже не зависит от случайных колебаний вариантов, учитывает всю сумму отклонений конкретных вариантов от среднего показателя. Показатель L - число именованное; его размерность соответствует размерности варьирующего признака.

Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

а) для первичного ряда б) для вариационного ряда

Это отклонение является общепри­нятым показателем вариации, в самых различных областях науки и практики. При его определении в расчет принимаются все отклонения значений варьирующего признака от среднего. Это также величина именованная. Среднее квадратическое отклонение, как и среднее линейное, показывает, на сколько в среднем отклоняются конкретные варианты от среднего их значения, но а более чутко реагирует на вариацию, и оно всегда больше среднего линейного отклонения. Зная его, можно по известному показателю определять неизвестный. Для альтернативных признаков формула среднего квадратического отклонения следующая где р - доля единиц в совокупности, обладающих определенным признаком; q- доля единиц, не обладающих этим признаком.

Коэффициент вариации является уже относительным показателем и применяется для сравнения вариации разных признаков. В нем именованный показатель вариации (среднее линейное или среднее квадратическое отклонение) соотносится со средней арифметической или заменяющей ее величиной (например, модой). Но обычно это , или чаще Исчисленный по среднему линейному отклонению показатель называют линейным коэффициентом вариации. В количественном отношении коэффициент V представляет собой своеобразную долю среднего отклонения в средней арифметической величине и выражается в процентах. Его универсальность проявляется в том, что он устраняет несопоставимость различных единиц измерения признака и различных величин средних арифметических. Коэффициент вариации очень широко применяется в экономических исследованиях особенно в анализе хозяйственной деятельности и эконометрике. Причем для различных типичных экономических процессов существуют принятые «нормальные» коэффициенты вариации.

Задание:

Вам предлагается дать более развернутую сравнительную характеристику рассмотренных обобщающих показателей вариации и их применение в практике вашего предприятия или образцов вашего статистического наблюдение.

Среди обобщающих показателей вариации особое место в статистике занимает дисперсия. Дисперсия - средний квадрат отклонений индивидуальных значений признака от средней арифметической:

Несмотря на прямую связь со средним квадратическим отклонением, дисперсия имеет самостоятельное значение. Для ее исчисления удобно пользоваться следующей формулой:

Если дисперсия взвешивается (подсчитывается по частотам), то применяется формула

Дисперсия альтернативного признака равна: σ2 = pq. Предельное ее значение равно 0,25, оно получается при р = 0,5.

Выделяют дисперсию общую, внутригрупповую и межгрупповую. Общая дисперсия 2) характеризует вариацию признака под влиянием всех факторов, вызвавших эту вариацию (формула ее приводилась выше). Внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:

где - групповая средняя, , - число единиц в группе.

Средняя из внутригрупповых дисперсий Заметим, чтоэта средняя отражает случайную вариацию, т.е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки.

Межгрупповая дисперсия, или дисперсия групповых средних вокруг общей средней, измеряет вариацию изучаемого признака под влиянием признака-фактора (группировочного признака) и подсчитывается по формуле:

где х, и n, - средние и численности по отдельным группам.

Математическая статистика доказывает, что между общей дисперсией, средней из внутригрупповых дисперсийи межгрупповой существует такая связь:

т.е. общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Это правило (закон) сложения дисперсий, логика которого проста: общая дисперсия, возникающая под влиянием всех факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки. Зная любые два вида дисперсий, всегда можно найти или проверить правильность расчета третьего вида дисперсии.

Изучение вариации имеет особый смысл в пределах однородной группы (за ними следуют уже качественные изменения).

Известное значение имеет также изучение случайной вариации. Бельгийский статистик А. Кетле обнаружил, что вариация некоторых массовых явлений подчиняется закону распределения ошибок (открыт К. Гауссом и П. Лапласом), или закону нормального распределения (термин К. Пирсона).

Кривая, отображающая это распределение, имеет вид колокола, и она симметрична. Очевидно и равенство здесь средней арифметической, моды и медианы между собой. Колеблемость индивидуальных значений признака находится в пределах х±3ст (точнее, в этих пределах лежат 997 единиц из 1000, или 99,7% всех единиц совокупности). Это закон вариации индивидуальных значений признака или "правило трех сигм". Правда, в быстроизменяющихся общественных явлениях нормальное распределение в чистом виде встречается крайне редко, но исследовать явление на нормальность целесообразно. Кроме того многие распределения можно условно разбить а несколько нормальных.

Выведен и другой закон - закон вариации средних величин, по которому вариация этих величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах

где п - число единиц.

Для анализа эмпирического распределения и выяснения того, в какой мере оно обусловлено действием внутренних причин, производится выравнивание фактического распределения признака по кривой нормального распределения. При этом используется то обстоятельство, что нормальное распределение полностью определяется двумя параметрами. Вначале по фактическому распределению вычисляются нормированные отклонения

.

Затем находятся соответствующие им теоретические частоты нормального распределения (они определяются по спе­циальным таблицам), которые и сравниваются с эмпирическими частотами. По сумме их различий можно судить о степени близости эмпириче­ского распределения к теоретическому.

Для объективного суждения о степени их близости (соответствия) используется ряд особых критериев, называемых критериями согласия или соответствия. К ним относятся критерии Пирсона, Ястремского, Романовского, Колмогорова (они доста­точно подробно излагаются в учебниках по математической статистики).

Так, критерий Пирсона (% ) вычисляется по формуле:

где fэ и fT — эмпирические и теоретические частоты соответственно. С помощью х2 по специальным таблицам определяется вероятность т\у}).

Критерии согласия дают общую оценку степени близости эмпирического распределения к теоретическому, однако не содержат информации о характере расхождений между ними.

Поэтому в анализе вариационных рядов применяются также специальные показатели, позволяющие охарактеризовать эти расхождения. Речь идет о коэффициентах асимметрии и эксцесса. С их помощью определяются направление и величина смещения (скошенности влево или вправо) и "крутости" или плотности значения признака вокруг значения средних фактического распределения, построенного по эмпирическим данным, по отношению к оси симметрии нормального распределения. Коэффициент асимметрии а) называется стандартизованным моментом третьего порядка.

где куб среднего квадратического отклонения.

Этот коэффициент имеет безразмерный характер, что и позволяет использовать его для сопоставления различных распределений. Если нормальное распределение характеризуется, как уже отмечалось, равенством средней арифметической, моды и медианы, то в эмпирическом эти величины обычно разнятся между собой. При левосторонней асимметрии Мо> Me > Xсредняя при правостороннейобратные соотношения. Это позволяет применять более простой показатель асимметрии, который называется коэффициентом К. Пирсона.

При левосторонней асимметрии эти показатели отрицательны, при правосторонней - положительны.

Анализ вариационного ряда предусматривает также определение эксцесса (Ех), т.е. степени "крутости" эмпирического распределения по отношению к нормальному. В качестве характеристики эксцесса используется центральный момент четвертого порядка µ4, равный Показателъ Ех определется по формуле:

Его количественное значение положительно при островершинности изучаемого распределения по отношению к нормальному то есть это указывает на наличие слабоварьирующего по данному признаку ядра, при отрицательном значении такого ядра нет, а распределение считается плосковершинным.

Степень существенности асимметрии и эксцесса можно оценить с помощью среднего квадратического отклонения ошибки асимметрии и эксцесса.

Средняя квадратическая ошибка коэффициента асимметрии зависит от числа единиц совокупности – n

σas = 6(n-1)/(n+1)(n+3)      

Если отношение коэффициента асимметрии взятого по модулю деленное на среднеквадратическую ошибку асимметрии больше трех - асимметрия существенна и показатели вариации сомнительны.

Аналогично анализируется эксцесс.

Средняя квадратическая ошибка коэффициента эксцесса зависит от числа единиц совокупности – n

σех = 24(n-2)(n-3)/(n-1)(n+3)(n+5)      

Если отношение коэффициента эксцесса взятого по модулю деленное на среднеквадратическую ошибку эксцесса больше трех – эксцесс существенен и показатели вариации сомнительны.

При использовании компьютера расчет показателей вариации удобно осуществлять при помощи специальных статистических пакетов таких как Stadia, Statistika и ряда других. Кроме того у любого пользователя имеющего компьютер работающий с операционной системой Windows наверняка установлен MS EXCEL, а у пользователей Linux Offiсe Open имеющие широкие возможности для статистической обработки с использованием стандартных функций. Для обработки вариационного ряда достаточно вызвать мастер функций, выбрать функции статистические и в меню вы найдете всё необходимое для расчета показателей вариации.

В частности СТАНДОТКЛОН - считает стандартное отклонение, СТАНДОТКЛОНА – учитывает логические и текстовые значения при расчете стандартного отклонения,

ДИСП – рассчитывает дисперсию по выборке,

ДИСПА – рассчитывает дисперсию с учетом текстовых и логических значений в выборке,

ДИСПР – вычисляют дисперсию по генеральной совокупности,

ДИСПРА – вычисляет дисперсию с учетом текстовых и логических значений в генеральной совокупности и так далее. Единственное, что нужно учесть так это странности перевода, так например, расчет асимметрии переведен как функция под названием «скос». Видимо переводчики посчитали, что слово асимметрия непонятно русскоязычному населению и выбрали очень старинное исконно русское слово – скос. Получилось смешно, но надо сказать, образно.

Второй метод быстрого получения необходимой информации связан с приложением к MS EXCEL, который называется «Пакет анализа». Активизируется он выполнением команд Сервис – Надстройки – Описательная статистика. После чего под значком Сервис в главном меню появляется команда «анализ данных». Выполнив эту команду вы можете получить за несколько секунд развернутую информацию почти по всем показателям вариации.

Диалоговое окно описательной статистики будет выглядеть так

Рисунок 12

А результат анализа вариации численности населения по данным переписи населения 2002 года по группам населения с интервалом в пять лет будет иметь следующий вид:

Таблица 4

Столбец1

Среднее

8058

Стандартная ошибка

843,1564

Медиана

8909,5

Мода

#Н/Д

Стандартное отклонение

3577,21

Дисперсия выборки

12796430

Эксцесс

-0,62137

Асимметричность

-0,56216

Интервал

11709

Минимум

1091

Максимум

12800

Сумма

145044

Счет

18

Наибольший(1)

12800

Наименьший(1)

1091

Уровень надежности(95,0%)

1778,905

При этом гистограмма будет выглядеть так:

График 8

Где ряд 1 численность населения в тысячах человек (шкала ординат).

Единственно, что здесь отсутствует это коэффициент вариации, но его можно легко рассчитать в любой клетке электронной таблицы так же как существенность ассиметрии и эксцесса.

3адание:

Для проверки усвоенного материала вам предлагается написать формулы асимметрии, средней гармонической взвешенной, межгрупповой дисперсии, медианы, среднего линейного отклонения, соотношения средней арифметической, моды и медианы при правосторонней асимметрии.

В рамках выполняемого вами задания из темы 5 на примере вариационного ряда распределения рабочих по часовой выработке и данных самого Контрольного задания рассчитайте обобщающие показатели вариации, включая дисперсии, и приведите необходимые комментарии. Сделайте выводы о нормальности распределения рабочих по часовой выработке. Проанализируйте вариацию численности населения по данным анализа и гистограммы.

ВЫВОДЫ

Завершив изучение этого раздела, вы усвоили основы средних величин, приобрели теоретические и практические знания по применению различных их видов и связанных со средними обобщающих показателей вариации.

Выделили наиболее распространенную на практике среднюю арифметическую с ее важными для статистики свойствами, а также дисперсию и коэффициент вариации.

Получили представление о законах вариации и распределения, о сравнительной оценке эмпирического и теоретического распределений на предмет их близости и расхождений. Научились рассчитывать эти показатели на компьютере.

Средняя величина является основной формой сводных показателей в статистике. Будучи исчисленной на единицу совокупности, она характеризует эту совокупность (ее необходимость, закономерность) в целом и потому обладает относительной устойчивостью.

Применяя средние величины, статистика решает многие задачи, связанные с изучением уровня и динамики развития явлений, сравнительной оценкой этих уровней, изучением взаимосвязи явлений, и делает это особенно успешно, когда оперирует не изолированными средними, а системой связанных друг с другом средних.

Средняя арифметическая, применяется во всех областях знаний, а ее свойства способны не только упростить расчеты, но обосновать нормальность явления или процесса. Свои конкретные задачи решают другие виды средней: средняя гармоническая, средняя квадратическая и средняя геометрическая. Выбор их обусловлен поставленной целью исследования, имеющейся информацией и характером самого осредняемого признака.

В область их использования включены динамика (динамические ряды), регрессионно-корреляционный анализ и т.д. Практически незаменимыми в изучении структуры рядов распределения особенно в экономическом анализе и маркетинге являются структурные средние - мода и медиана.

Значительное внимание в Разделе 3 было уделено обобщающим показателям вариации, дополняющим средние величины и комплексно характеризующим вариацию изучаемых признаков в совокупности.

Каждый из них имеет свое назначение и свои особенности и, главное, они дополняют друг друга.

Таковы размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, коэффициент вариации и дисперсия (общая, внутригрупповая и межгрупповая). Для сопоставления и сравнительной оценки эмпирического распределения с теоретическим, выявления их близости и расхождений статистика использует и другие специальные характеристики, именуемые критериями согласия и показателями асимметрии и эксцесса.

В этом разделе Вы продолжили выполнение сквозного Контрольного задания, обогатив свои теоретические знания практическими расчетами многих из рассмотренных выше статистических средних величин и обобщающих показателей вариации. Сделанное в разделе 3 послужит вам хорошей основой для изучения статистики в последующих разделах и темах.