Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА.doc
Скачиваний:
40
Добавлен:
21.02.2016
Размер:
1.87 Mб
Скачать

Тема 8. Статистические методы измерения взаимосвязей.

  1. Виды связей между явлениями.

  2. Регрессионный анализ.

  3. Корреляционный анализ.

  4. Анализ связи между атрибутивными признаками.

  1. Виды связей между явлениями.

Все социально-экономические явления взаимосвязаны и зависимость между ними носит причинно-следственный характер. Суть причинно- следственной связи состоит в том, что при определенных условиях одно явление обуславливает другое и в результате такого взаимодействия возникает следствие.

Изучая закономерности связи, причины и условия, которые их характеризуют, объединяют в понятие фактора.

Признаки, которые являются причинами и условиями связи, называются факторными (х), а которые изменяются под влиянием факторных признаков – результативными (у).

Выделяют 3 вида взаимосвязей:

- факторные (изучаются с помощью метода группировок и теории корреляции);

- компонентные (изучаются с помощью индексного метода);

- балансовые (изучаются путем построения балансов).

В зависимости от статистической природы между признаками х и у существуют разные по характеру виды связи:

- функциональные;

- стохастические (вероятностные).

При функциональной связи между х и у каждому значению х соответствует одно четко определенное значение у.

При стохастической связи каждому отдельному значению факторного признака х соответствует определенное множество значений результативного признака у.

Подвидом стохастической связи является корреляционная зависимость, которая обуславливает корреляционную связь между признаками. При такой зависимости с изменением факторного признака х изменяется групповой средний результат признака у.

По своей форме корреляционные связи бывают:

- прямые (если х и у изменяются в одном направлении, т.е. ибо снижаются, либо увеличиваются) и обратные (если при увеличении х снижается у и наоборот);

- прямолинейные (выражаются уравнениями прямой) и криволинейные (выражаются уравнениями параболы, гиперболы и т.д.);

- однофакторные (если исследуется связь между одним факторным признаком х и результативным у) и многофакторные (если исследуется связь между несколькими факторными признаками х и результативным у).

Главной характеристикой корреляционной связи является линия регрессии.

Линия регрессии У(х) – это функция, которая связывает средние значения У со значениями х.

В зависимости от формы линии регрессии выделяют линейные (в виде прямой) и нелинейные связи.

В процессе корреляционно-регрессионного анализа решаются 2 задачи:

- определить теоретическую форму связи (регрессионный анализ);

- определить тесноту, статистическую значимость и надежность связи (корреляционный анализ).

  1. Регрессионный анализ.

Изучение корреляционной связи начинается с регрессионного анализа, который решает проблему установления формы связи или вида уравнения регрессии и определения параметров уравнения регрессии.

Различают уравнения простой (парной) регрессии (когда один х соответствует у) и множественной (многофакторной) регрессии (когда результативный признак у связан с несколькими факторными признаками х).

Уравнение регрессии показывает, как в среднем изменяется у при изменении какого-либо хі и имеет вид:

У(х) = f(х12…хn).

Наиболее часто для характеристики корреляционной связи используют такие виды уравнений парной регрессии:

  • линейное = а0 + a1 x;

  • гиперболическое ;

  • параболическое = а0 + а1 x + а1 x2 и т.д.

где а0, а1 – параметры уравнений регрессии, которые необходимо определить.

Параметр а0 показывает усредненное влияние на результативный признак факторов, которые не учтены.

Параметр а1 показывает насколько изменяется в среднем значение результативного признака при увеличении факторного признака на единицу.

Параметры в уравнениях регрессии определяются методом наименьших квадратов, суть которого в минимизации суммы квадратов отклонений фактических значений результативного показателя от расчетных значений.

Система нормальных уравнений для нахождения параметров линейной регрессии методом наименьших квадратов имеет такой вид:

па0 + а1S x= S у;

а0S x + а1S x2 = S xу,

где n – объем исследуемой совокупности (число единиц наблюдения).

Например, имеются данные, характеризующие деловую активность акционерных обществ закрытого типа (АОЗТ): прибыль (млн. грн.) и затраты на 1 грн. произведенной продукции (коп). (табл.8.1).

Предположим наличие линейной зависимости между анализируемыми признаками. Система нормальных уравнений для данного примера имеет вид:

па0 + а1S x= S у;

а0S x + а1S x2 = S xу,

Подставив данные, рассчитанные в табл.8.1. получим:

0 + 502а1 = 4466;

502 а0 + 42280 а1 = 362404.

Таблица 8.1

Расчетные данные для определения параметров линейного уравнения регрессии

Затраты на 1 грн. произведенной продукции, коп. ,

х

Прибыль,

тыс. грн.,

у

x2

ху

__

Ux

1

2

3

4

5

6

77

77

81

82

89

96

1070

1001

789

779

606

221

5 929

5 929

5 561

6 724

7 921

9 216

82 390

77 077

63 909

63 878

53 934

21 216

1 016

1 016

853

812

527

242

Итого

502

4 466

42 280

362 404

4 466

Решив систему уравнений получим: а0 = 4153,88; а1 = - 40,75

Таким образом, Ух = 4153,88 - 40,75x.

Если связь между признаками х и у является криволинейной и описывается уравнением параболы второго порядка:

= а0 + а1 x + а2 x2

задача сводится к определению неизвестных параметров: а0, а1, а2, а система нормальных уравнений имеет вид:

па0 + а1S x + а2S x2 = S у;

а0S x+ а1S x2 + а2S x3 = S уx;

а0S x2 + а1S x3 + а2S x4 = Sуx2.

Оценка обратной зависимости между х и у, когда при увеличении (уменьшении) х уменьшается (увеличивается) значение результативного признака у, может быть осуществлена на основе уравнения гиперболы:

.

Систему нормальных уравнений для нахождения параметров гиперболы можно представить следующим образом:

Наиболее сложным этапом, который завершает регрессионный анализ, является интерпретация уравнения, т.е. перевод его с языка статистики и математики на язык экономиста.

С целью расширения возможностей экономического анализа используется коэффициент эластичности, который определяется по формуле:

,

где xі - среднее значение соответствующего факторного признака;

- среднее значение результативного признака;

аі - коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1 %.

  1. Корреляционный анализ.

После выбора вида уравнения регрессии и нахождения его параметров приступают к оценке тесноты и значимости (существенности) связи.

Тесноту святи оценивают с помощью коэффициентов детерминации, корреляции (корреляционного отношения).

Коэффициент детерминации показывает, в какой степени вариация результативного признака у определяется вариацией факторного признака х. Он используется как при линейной, так и при нелинейной связи между признаками и в случае парной регрессии рассчитывается по формуле:

где у – фактические значения результативного признака;

У – теоретические значения результативного признака (по линии регрессии).

Коэффициент детерминации принимает значения от 0 до 1. Чем ближе он к одинице, тем теснее связь между признаками; если коэффициент детерминации равен 0 линейная связь между показателями отсутствует; если равен 1 - не существует корреляционной связи между признаками.

Коэффициент корреляции (корреляционное отношение) показывает насколько значительным является влияние фактора х на у и рассчитывается по формуле:

Он находится в диапазоне от 0 до1; чем ближе к единице, тем теснее корреляционная связь между признаками.

В случае линейной связи между х и у линейный коэффициент корреляции рассчитывается по формуле:

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1£ r £1.

После установления тесноты связи дают оценку значимости связи между признаками. Под термином «значимость связи» понимают оценку отклонений выборочных переменных от своих значений в генеральной совокупности с помощью статистических критериев. Оценку значимости связи осуществляют с использованием F-критерия Фишера и t-критерия Стьюдента.

Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:

где 1, (n-2) – число степеней свободы числителя и знаменателя зависимости.

«Степень свободы» - целое число, которое показывает сколько независимых элементов информации в переменных у необходимо для суммы квадрата (это поясняет соответствующую дисперсию: общую, среднюю из групповых, межгрупповую).

Теоретическое значение F сравнивают с табличным (критическим) значениемFтабл, которое выбирают из справочных математических таблицF-критерия Фишера в зависимости от степеней свободы 1, (n-2) и принятого уровня значимости . Чаще всего в статистико-экономических исследованиях используют такие уровни значимости, как=0,05 и=0,01. ЕслиF> Fтабл, то выборочная совокупность и связь между признаками являются значительными.

Для парной линейной регрессии при r=R расчетные значения t –критерия Стьюдентаопределяются по формуле:

Критерий Стьюдента дает оценку значимости коэффициента корреляции R и существенности связи между признаками.

Рассчитанное по формуле теоретическое значение t–критерия Стьюдента сравнивают с табличным для соответствующего числа степеней свободы и принятого уровня значимости . Табличное значение критерия Стьюдента выбирается из справочных математических таблиц. Если t>tтабл,то линейный коэффициент корреляции считается значимым при характеристике генеральной совокупности.

  1. Анализ связи между атрибутивными признаками.

Использование регрессионного и корреляционного анализа предполагает, чтобы все признаки были количественно измерены. Методы корреляционно-регрессионного анализа, основанные на использовании количественных параметров распределения (средние величины, дисперсии), называют параметрическими методами.

Проблему оценки тесноты связи между атрибутивными признаками решают непараметрические методы. Сфера их использования значительно шире, т.к. не требуется использования условия нормального распределения результативной переменой.

Для определения тесноты связи двух качественных признаков, каждый из которых состоит из двух групп, используют коэффициенты ассоциации Д.Юла и контингенции К.Пирсона.

Коэффициент ассоциации Ка определяется по формуле:

,

Коэффициент контингенцииопределяется по формуле:

.

Для определения этих коэффициентов не обходимо построить так называемую «таблицу четырех полей».

а

b

a+b

с

d

c+d

а+с

b+d

a+b+c+d

Коэффициент контингенции изменяется от +1 до -1, но всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка0,5 або Кк0,3.

Например, нужно оценить наличие связи между работниками строительной организации, разделенными по полу и содержанию работы. Для этой цели был проведен анализ «Исследование социальных аспектов трудовой деятельности работников строительных организаций». Результаты исследования представлены в табл. 8.2.

Таблица 8.2

Распределение работников по полу и оценке содержания работы

Работа

Мужчины

Женщины

Всего

Интересная

Неинтересная

300 (а)

130 (с)

201 (b)

252 (d)

501 (a+b)

381 (c+d)

Всего

430 (a+c)

453 (b+d)

883 (a+b+c+d)

В данном примере коэффициент ассоциации будет равен:

.

Связь подтверждена.

Для определения связи между количественными или качественными признаками при условии, что значения этих признаков проранжированы по степени убывания или возрастания признака, может быть использован коэффициент Спирмена, который рассчитывается по формуле:

,

де - квадрат разности рангов;

n - число наблюдений (число пар рангов).

Когда каждый из качественных признаков состоит более чем из двух групп, для определения тесноты связи можно использовать коэффициент взаимной спряженности (согласованности) К.Пирсона, который рассчитывается по формуле:

,

де - показатель взаимной спряженности.

Расчет коэффициента взаимной спряженности производится по такой схеме (табл.8.3).

Таблица 8.3

Схема расчета коэффициента взаимной спряженности

Группы признака

А

Группы признака В

Всего

В1

В2

В3

А1

А2

А3

Всего

f1

f4

f7

m1

f2

f5

f8

m2

f3

f6

f9

m3

n1

n2

n3

Расчет производится следующим образом:

по первой строчке: ;

по второй строчке: ;

по третьей строчке: ;

.

Например, исследуем связь между себестоимостью продукции и накладными затратами на реализацию (табл.8.4).

Таблица 8.4

Накладные затраты

Себестоимость

Всего nі

zi

низкая

средняя

высокая

fi

fi2

fi2/30

fi

fi2

fi2/40

fi

fi2

fi2/50

Низкие

Средние

Высокие

19

7

4

361

49

16

12,03

1,63

0,53

12

18

10

144

324

100

3,6

8,1

2,5

9

15

26

81

225

676

1,62

4,5

13,5

40

40

40

17,25

14,23

16,53

0,431

0,356

0,413

Всего

30

40

50

120

1,2

По данным таблицы:

;

.

Достаточно высокое значение С указывает на наличие связи между исследуемыми признаками

Коэффициент знаков (коэффициент Фехнера) рассчитывается на основе определения знаков отклонений вариантов двух взаимосвязанных признаков от их средних величин.

Если число совпадений знаков обозначить через а, число несовпадений – через b, то этот коэффциент определяется по формуле:

.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]