Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ОТС.doc
Скачиваний:
8
Добавлен:
21.04.2015
Размер:
730.62 Кб
Скачать

Тема 8. Статистический анализ взаимосвязей социально-экономических явлений

Любое общественное явление находится в связи с другими явлениями. Исследование таких взаимосвязей – важнейшая задача статистики.

Различают два вида связей, существующих между явлениями – функциональные и стохастические.

Функциональной называется зависимость, при которой одному значению факторного признака строго соответствует единственное значение результативного признака.

Стохастическая зависимость характеризуется тем, что результативный признак не полностью определяется факторным признаком, его влияние проявляется в среднем при достаточно большом числе наблюдений.

Наиболее часто для исследования стохастических зависимостей используют метод корреляции.

Термин корреляция происходит от английского слова correlation – соотношение, соответствие.

К изучению связи методом корреляции обращаются в том случае, когда нельзя изолировать влияние посторонних факторов. При этом число наблюдений должно быть достаточно велико, так как малое число наблюдений не позволяет обнаружить закономерность связи.

Первая задача корреляции заключается в математическом выражении изменения результативного признака в связи с изменением одного или несколько факторных признаков. Данная задача решается определением уравнения регрессии и носит название регрессионного анализа. Вторая задача состоит в определении степени влияния искажающих факторов –различных показателей тесноты связи и называется корреляционным анализом.

Регрессионный анализ включает в себя этапы:

1. Логический анализ – разделение коррелирующих признаков на факторные и результативный.

2. Определение типа зависимости. Корреляционная зависимость называется парной, если она имеет место между двумя признаками (факторным и результативным) и множественной (многофакторной) – между тремя и более связанными между собой признаками.

Парная зависимость называется прямолинейной, если может быть описана уравнением прямой линии икриволинейной, описываемой уравнением:

гиперболы

параболы и т.д.

Определить тип уравнения зависимости можно, исследуя зависимость графически, построением корреляционного поля или эмпирической линии регрессии.

То при построении корреляционного поля, в системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой, как это показано на рис. 5.

y

x

Рис. 5. График корреляционного поля

При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем теснее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связей.

Эмпирическая линия регрессии строится в системе координат, где на оси абсцисс откладывается значение факторного признака, а на оси ординат рассчитанное среднее для данного факторного признака значение результативного.

3. Определение параметров уравнения регрессии. Оценка параметров уравнения регрессии (а0, а1, а2 и т.д.) осуществляется методом наименьших квадратов на основе системы нормальных уравнений.

Для нахождения параметров линейной парной регрессии () система нормальных уравнений имеет вид:

Для гиперболы

Для параболы второго порядка

Для многофакторной зависимости:

……………………………………………………………………

В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков, а коэффициенты регрессии а1, а2, …, аn показывают, на сколько изменяется в среднем значение результативного признака при увеличении факторного признака на единицу собственного измерения.

Корреляционный анализ

Для оценки тесноты связи в статистическом анализе используют показатели:

Эмпирического корреляционного отношения (ηэ)

где межгрупповая вариация результативного признака;- общая вариация результативного признака.

Наличие взаимосвязей между результативным и факторным признаком имеет при η≤0,5.

Универсальным показателем тесноты связи является показатель теоретического корреляционного отношения или индекс корреляции (ηm).

где - рассчитанные (теоретические) значения результативного признака.

Показатель теоретического корреляционного отношения может использоваться для оценки тесноты связи не только в парных, но и многофакторных зависимостей.

Для оценки тесноты связи прямолинейной зависимости используется линейный коэффициент корреляции (r).

или

Линейный коэффициент корреляции может изменяться от -1 до +1. Чем ближе значение r по абсолютной величине к единице, тем теснее связь. Если r>0, то связь между факторным и результативным признаками прямо пропорциональная, если r<0, то обратно пропорциональная.

Для предварительной оценки тесноты связи корреляции может использоваться коэффициент корреляции знаков (коэффициент Г. Фехнера).

Для определения коэффициента знаков Г. Фехнера вычисляются средние значения факторного и результативного признаков, затем определяются знаки отклонений от средней всех значений взаимосвязанных признаков. Приняв число совпадений знаков отклонений индивидуальных значений от средней за «С», а число несовпадений за «Н», коэффициент определяется следующим образом:

Коэффициент Г. Фехнера может принимать значения от -1 до +1, если он положительный, то связь между признаками признается прямой, если отрицательный, то обратной.

Рассмотренные выше показатели корреляции приемлемы лишь для условий нормального или близкого к нормальному распределения и только для количественных признаков. Если эти условия отсутствуют и к тому же исследуются атрибутивные признаки, то приходится пользоваться непараметрическими методами корреляционного анализа, в частности корреляцией рангов или ранговой корреляцией. Ранг признака (Ri) указывает то место, которое занимает i-й признак среди других n-признаков в ранжированном ряду распределения.

Если одно и то же значение признака в ранжированном ряду распределения занимает разные порядковые номера, то ранг признака определяется по сопряженному рангу (), рассчитанному, как среднее арифметическое порядковых номеров, занимаемых данным признаком.

Для такого рода ранжированных признаков показатели тесноты связи служат коэффициенты корреляции рангов К. Спирмэна (ρ) и М. Кендэла (τ).

где n – число сопоставимых пар; d – разность между рангами коррелирующих признаков ().

Этот коэффициент интерпретируется также, как и линейный коэффициент корреляции, имеет те же свойства и пределы значений (от -1 до +1).

где Z – алгебраическая сумма числа высших (P) и низших (Q) рангов по отношению к каждому последующему рангу y, сопоставленному в строгом соответствии с рядом значений х в восходящем или нисходящем порядках, т.е. Z=P-Q.

Расчет данного коэффициента выполняется в следующем порядке:

1. Значения признака х выстраиваются в строчной последовательности возрастания или убывания.

2. Значения у располагаются в порядке, соответствующем значениям х.

3. Для каждого ранга у определяется число следующих за ним значений рангов, превышающих его величину. Суммируя эти числа определяется величина Р, как мера соответствия последовательностей рангов х и у.

4. Для каждого ранга у определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина этих чисел обозначается Q.

Как правило, коэффициент М. Кендэла меньше коэффициента Спирмэна.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) , который вычисляется по формуле:

где m – количество факторов; S – отклонение суммы квадратов рангов от средней квадратов рангов.

Связь между признаками признается значимой, если значение коэффициентов корреляции рангов больше 0,5.

Для оценки тесноты связей между атрибутивными признаками, помимо коэффициентов ранговой корреляции могут применяться специальные коэффициенты.

Для атрибутивных признаков (чаще всего, альтернативных) представленных тетрахорической таблицей (таблицей четырех полей, с частотами a, b, c, d). Как показано в табл. 1 используется коэффициент ассоциации Дж. Юла (Ка) и коэффициент контингенции К. Пирсона (Кк)

Таблица 1

Схема таблицы четырех полей

Варианты значений

результативного признака

Варианты значений факторного признака

1 (да)

2 (нет)

Итого

1 (да)

а

b

a+b

2 (нет)

с

d

c+d

Всего

а+с

b+d

n

;

Коэффициент контингенции всегда меньше коэффициента ассоциации и дает более осторожную оценку тесноты связи. Связь можно считать значимой, если величина этих коэффициентов не меньше 0,3 и 0,5 соответственно.

Теснота связей между атрибутивными признаками с большим числом вариантов измеряется с помощью коэффициентов сопряженности К. Пирсона (Кn) или А. Чупрова (Кr).

;

.

где n1 – число вариантов признака по горизонтали; n2 – число вариантов признака по вертикали; φ2 – показатель взаимной сопряженности.

где - частота внутри клетки таблицы;- итоговая частота по строке;- итоговая частота по графе.

Коэффициент сопряженности А. Чупрова считается более точным показателем по сравнению с показателем К. Пирсона, так как учитывает число образованных по признакам групп.