Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Хабаровский государственный университет экономики и права

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Эконометрика.doc / Эконометрика.doc

Скачиваний:

245

Добавлен:

11.04.2015

Размер:

7.44 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 326 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

1.2.7. Коэффициент ранговой корреляции Спирмена

Как известно, вычисление коэффициента линейной корреляции Пирсона осуществляется в предположении действия нормального закона распределения. При этом используются точные количественные значения переменных. В случае, если закон распределения неизвестен или известно, что он отличен от нормального (в том числе и для нелинейных зависимостей), а также для данных, измеренных в ранговой шкале, для определения тесноты связи между изучаемыми переменными рекомендуется использовать ранговую корреляцию. Теснота ранговой корреляции измеряется с помощью коэффициента ранговой корреляции Спирмена (r_s).

Вычисляется такой коэффициент из соотношения

r_s= 1 – ,

где d_i=x_i–y_i, аx_iиy_i– ранги наблюдений.

Коэффициент ранговой корреляции Спирмена имеет те же свойства, что и коэффициент парной корреляции Пирсона, но он устойчив по отношению к неравномерности информации. С его помощью можно изучать взаимосвязь не только между значениями переменных, но и между их рангами. Например, зависимость между сортностью продукции, ее сроком службы и производственными затратами. Для этого элементы изучаемой совокупности располагаются в определенном порядке и каждому элементу упорядоченного ряда присваивают ранг или номер и затем изучается теснота связи между рангами.

Как и коэффициент парной корреляции Пирсона, коэффициент ранговой корреляции r_s1. Еслиr_s= 1, то это означает, что каждый элемент последовательности рангов занимает одно и то же место в обоих рядах и мы имеем полную положительную корреляцию рангов. В случае, когдаr_s= –1, элементы двух последовательностей расположены в обратном порядке и между рангами наблюдается полная рассогласованность. Еслиr_s= 0, имеем полное отсутствие корреляции между рангами.

Значимость коэффициента ранговой корреляции Спирмена определяется по статистике z=r_s/s=r_s. Расчетное значение статистикиzсравнивается с табличнымz__/2(при фиксированном уровне значимости), и, если, например,zz__/2, делаем вывод о том, что коэффициент корреляции не равен нулю. При компьютерных расчетах с помощью статистических ППП, как и в случае коэффициента корреляции Пирсона, для определения значимостиr_sдостаточно воспользоваться р-величиной.

Коэффициент ранговой корреляции используется также в случаях, когда изучаются взаимосвязи между явлениями, которые не поддаются количественной оценке. К подобным исследованиям, например, относится изучение взаимосвязей между такими переменными, как интегральный показатель эффективности функционирования социально-экономической системы (специалиста, предприятия, научно-производственного объединения и т. п.), качество (мера оптимальности) структуры потребительского бюджета семьи, степень прогрессивности предполагаемого проекта решения социально-экономической, технической или другой проблемы и т.п. В этих случаях каждому объекту ставится в соответствие некоторая условная числовая метка, обозначающая место этого объекта в ряду из всех анализируемых объектов, упорядоченных по убыванию степени проявления в них изучаемого свойства. Такие переменные называются порядковыми или ранговыми и используются для ранжирования (сравнительной оценки) рассматриваемых объектов.

Кроме того, порядковые переменные используются в социологических исследованиях при составлении анкет и их обработке.

В заключение отметим, что в отличие от коэффициента корреляции Пирсона ранговый коэффициент корреляции Спирмена не чувствителен к асимметрии и выбросам.

Пример.Анализ функции потребления

Рассмотрим условный пример, в котором необходимо проанализировать зависимость расходов от доходов, используя простую регрессию и корреляцию, а также спрогнозировать расходы семей, чьи доходы равны соответственно: 4, 6, 8 и 9,5.

Пусть имеются данные о доходах (х) и расходах (у) у 21 семьи за определенный промежуток времени:

Таблица исходных данных для примера Таблица 1.3

х	4,2	2,9	7,1	4,9	6,4	2,1	3,5	7,5	5,0	2,4
у	4,3	3,6	6,0	4,6	7,1	2,3	3,9	9,1	5,1	3,6
7,9	4,9	2,5	6,1	3,2	9,2	4,2	5,5	3,6	5,2	8,5
8,2	4,7	4,0	6,0	4,2	7,5	5,2	5,6	4,4	5,0	10,5

Просчитаем уравнение парной линейной регрессии, используя ППП StatgraphicsPlusсо всеми показателями точности уравнения регрессии, приняв за зависимую переменную расходы семьи, а за независимую – доходы. Отчет о регрессии приведен ниже (см. рис.1).

Рис. 1. Отчет о регрессии на основе ППП StatgraphicsPlus5.1

Итак, уравнение регрессии имеет вид: = 1,19 + 0,85х.

Здесь – Intercept(пересечение) = 1,19,Slope(наклон) = 0,85 (эти значения взяты из столбцаEstimate– оценка).

При этом статистика Фишера F= 87 (см. на рис. 1 таблицу дисперсионного анализа (AnalysisofVariance)), а расчетный уровень ее значимости равен нулю (p-Value= 0,0). Это означает, что уравнение регрессии значимо.

Как уже отмечалось, проверка значимости коэффициента парной регрессии аналогична проверке значимости уравнения регрессии в целом и статистика Стьюдента для этой проверки равна корню квадратному из статистики Фишера (или t²=F), что легко проверить (9,33²= 87,05) (небольшое расхождение за счет округления).

Итак, коэффициент регрессии значимо отличен от нуля. Известно, что подобного рода зависимость расходов от доходов в эконометрике называется функцией потребления. Коэффициент регрессии в этом случае показывает, на сколько изменится расход при дополнительном увеличении дохода на 1 тыс. рублей, и характеризует склонность к потреблению. В нашем примере из каждой тысячи рублей дохода на потребление расходуется 850 руб., а 150 руб. откладывается на будущее (инвестируется).

Показатель, характеризующий склонность к потреблению, используется для расчета мультипликатора, который в нашем случае равен 1/(1–b) = 6,67. Это означает, что при дополнительном инвестировании 1 тыс. руб. на отдаленную перспективу, получим дополнительный доход в размере 6,67 тыс. руб. Явно завышенный результат здесь получился потому, что данный показатель (склонность к потреблению) эффективен при подобных расчетах в случае его малости.

Свободный член уравнения регрессии положителен (равен 1,19). Это означает, что в нашем примере расходы изменяются более интенсивно, чем доходы. Это подтверждается и расчетами коэффициентов вариации для этих показателей. Для расходов и доходов они соответственно равны 41 % и 35,5 % (рассчитать самостоятельно, если известно, что =5,01,=5,51,S_x=2,1,S_y=1,95).

Коэффициент регрессии используется также при расчете коэффициента средней эластичности, который равен э = (в_*/), и показывает, на сколько процентов в среднем изменится значение зависимой переменной при изменении независимой переменной на 1 %. В нашем случае э = (0,85*5,01/5,51) = 0,77. Это означает, что при изменении доходов на 1 % расходы изменятся в среднем на 0,77 %.

Теснота линейной корреляционной связи между изучаемыми показателями оценивается коэффициентом корреляции, который равен 0,906, и в соответствии со шкалой Чеддока можно сказать, что теснота этой связи весьма высокая.

Рассчитайте статистику Стьюдента для проверки гипотезы о том, что коэффициент корреляции равен нулю, и убедитесь, что в случае парной регрессии она совпадет со статистикой Стьюдента для проверки гипотезы о равенстве нулю коэффициента регрессии, а ее квадрат равен значению критерия Фишера для проверки гипотезы о значимости уравнения регрессии в целом.

Коэффициент детерминации (R-squared) равен 82,1 %, следовательно, в нашем примере изменение расходов на 82,1 % зависит от изменения доходов, а остальные 17,9 % изменения доходов зависят от неучтенных факторов, в том числе и от случайных.

Стандартная ошибка оценки по регрессии (StandardErrorofEst.) равна 0,85, и это означает, что, оценивая расходы по известной величине доходов по данному уравнению регрессии, мы в среднем ошибаемся на эту величину.

Приведем графический отчет о полученной регрессии (рис. 2 и рис. 3).

Рис. 2. График подобранной линии регрессии (ППП StatgraphicsPlus)

Рис. 3 График остатков подобранной линии регрессии (ППП StatgraphicsPlus)

Расположение линии регрессии среди точек подтверждает правильность выбора линейной зависимости между изучаемыми показателями. Штриховые линии вокруг линии регрессии показывают доверительную область линии регрессии и прогнозных значений. Приведем прогнозные расчеты расходов семей для указанных в условии примера доходов. Расчеты проведем с помощью процедуры Forecasts, имеющейся среди табличных опций простой регрессии в ПППStatgraphics(рис. 4):

Рис. 4 Окно отчета о прогнозе по уравнению регрессии

Кроме точечных прогнозов здесь указаны и интервальные прогнозы для расчетных и прогнозных значений расходов. Если на рис. 2 провести вертикальные линии через абсциссы с указанными значениями доходов, то каждая из таких линий пересечет график в 5 точках, которые и отражены в отчете на рис. 4. Так, например, если доходы семьи будут равны 6 у. е., то в соответствии с найденным уравнением расходы такой семьи будут равны 6,5755 (точечный прогноз – это точка пересечения линии регрессии с прямой х = 6), а интервальных прогноза два: (5,95;7,28) для расчетного значения расходов и (4,81;8,34) для прогнозных расходов. На рис. 2 эти интервалы получатся при пересечении линии х = 6 с двумя доверительными областями линии регрессии: для самой линии и для прогнозных значений зависимой переменной.

<<< < Предыдущая 1 2 3 4 56 / 326 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>