- •Глава 9. Изучение динамики комплекса взаимосвязанных признаков
- •9.1. Динамика жестко связанной системы признаков (показателей)
- •Вектор валового сбора
- •9.2. Агрегирование трендов и колебаний по совокупности объектов
- •9.2.1. Тренды объемных признаков
- •9.2.2. Тренды качественных признаков
- •9.2.3. Агрегирование показателей колеблемости
- •9.3. Корреляция между временными рядами: сущность, ограничения
- •9.4. Методы измерения корреляции между колебаниями признаков
- •Корреляция урожайности картофеля с его себестоимостью совхоза им. Ленина Волосовского района Ленинградской области
- •Корреляция отклонений от средних отклонений
- •9.5. Корреляция с учетом лага и циклов
- •Корреляция отклонений от тренда с неизвестным заранее лагом
- •9.6. Понятие о динамике комплекса статистически взаимосвязанных признаков
9.4. Методы измерения корреляции между колебаниями признаков
Итак, в предыдущем разделе было установлено, что единственная «чистая» задача об измерении корреляции временных рядов - это измерение связи между колебаниями их уровней. Колебания - это, как правило, случайная составляющая, в отличие от тренда. Если же и колебания не случайны, а строго упорядочены, как, например, сезонные, то и задача о связи таких колебаний не является «чистой», так как содержит риск ложной связи. В связи с этим далее рассматриваются лишь случайно распределенные во времени колебания, например колебания урожайности.
Классический пример, иллюстрирующий отличие корреляции отклонений от тренда и корреляции уровней ряда, - это связь, наблюдавшаяся в 1970-1989 гг. в СССР между урожайностью сельскохозяйственных культур и себестоимостью единицы их продукции. Урожайность большинства культур в подавляющей части регионов в 70-80% хозяйств имела тенденцию роста, хотя и медленного, а в отдельных хозяйствах - довольно быстрого. Согласно законам экономики, как рыночной, так и плановой, рост урожайности должен приводить к снижению себестоимости единицы продукции. Однако на самом деле в большинстве, если не во всех хозяйствах и регионах, наоборот, себестоимость имела тенденцию роста. Скрытой причиной этого явления была не признаваемая официально инфляция - рост цен на все элементы затрат на производство: сельскохозяйственные машины, энергоносители, удобрения. Рассмотрим пример, представленный в табл. 9.3.
Если рассчитывать коэффициент корреляции между уровнями рядов по обычной формуле
то получаем величину -0,055, незначимо отличную от нуля. Параллельность трендов урожайности и себестоимости погасила обратную связь их колебаний, что привело к результату, противоречащему законам экономики.
Рассмотрим теперь другую методику: измерение корреляции между отклонениями уровней от трендов. Подставляя отклонения от трендов в обычную формулу коэффициента корреляции, имеем:
Таблица 9.3
Корреляция урожайности картофеля с его себестоимостью совхоза им. Ленина Волосовского района Ленинградской области
Год |
Урожайность, ц/га, |
Себестоимость, руб/ц, |
Тренды |
Отклонения от трендов |
Квадраты отклонений |
Произведения
|
руб/ц | |||||||
|
|
|
|
|
| |||||||||
1977 |
108 |
11,8 |
97 |
11,7 |
+11 |
+0,1 |
121 |
0,01 |
+1,1 |
10,3 | ||||
1978 |
81 |
15,4 |
101 |
12,9 |
-20 |
+2,5 |
400 |
6,25 |
-50,0 |
15,4 | ||||
1979 |
106 |
13,0 |
105 |
14,1 |
+1 |
-1,1 |
1 |
1,21 |
-1,1 |
14,0 | ||||
1980 |
124 |
13,9 |
108 |
15,3 |
+16 |
-1,4 |
256 |
1,96 |
-22,4 |
13,3 | ||||
1981 |
103 |
15,1 |
112 |
16,6 |
-9 |
-1,5 |
81 |
2,25 |
+13,5 |
17,7 | ||||
1982 |
106 |
19,6 |
116 |
17,8 |
-10 |
+1,8 |
100 |
3,24 |
-18,0 |
19,0 | ||||
1983 |
149 |
16,2 |
120 |
19,0 |
+29 |
-2,8 |
841 |
7,84 |
-81,2 |
15,4 | ||||
1984 |
148 |
17,2 |
124 |
20,2 |
+24 |
-3,0 |
576 |
9,00 |
-72,0 |
17,2 | ||||
1985 |
102 |
24,0 |
128 |
21,4 |
-26 |
+2,6 |
676 |
6,76 |
-67,6 |
24,6 | ||||
1986 |
130 |
22,4 |
131 |
22,7 |
-1 |
-0,3 |
1 |
0,09 |
+0,3 |
22,8 | ||||
1987 |
80 |
32,3 |
135 |
23,9 |
-55 |
+8,4 |
3025 |
70,56 |
-462,0 |
30,7 | ||||
1988 |
139 |
24,7 |
139 |
25,1 |
0 |
-0,4 |
0 |
0,16 |
0,0 |
25,1 | ||||
1989 |
183 |
21,1 |
143 |
26,3 |
+40 |
-4,9 |
1600 |
24,00 |
-196,0 |
21,3 | ||||
Σ |
1559 |
247,0 |
1559 |
247,0 |
0 |
0,0 |
7678 |
133,30 |
-952,7 |
246,8 |
Однако так как средние величины отклонений от линейных и параболических трендов всегда равны нулю, а от других форм тренда близки к нулю, если эти формы трендов правильно выбраны, то
и формула приобретает вид:
|
(9.8) |
Соответственно формула коэффициента регрессии также меняется:
|
(9.9) |
Свободный член уравнения регрессии определяем по обычной формуле: т.е. для отклонений от трендов:
Уравнение регрессии имеет вид:
|
(9.10) |
Подставляя данные из табл. 9.3, получаем:
Таким образом, колебания себестоимости картофеля в совхозе почти целиком были связаны с колебаниями урожайности, связь обратная, как и требуют законы экономики. И вся она была подавлена тем, что оба тренда имели одно и то же направление по совершенно разным причинам: прогресс агротехники - не причина инфляции и роста цен. Равно как и наоборот: инфляция скорее тормозила прогресс урожайности.
Коэффициент регрессии: уравнение регрессии:
Смысл этого уравнения таков: в среднем отклонение себестоимости от ее тренда в i-м году составляет 0,124 величины отклонения урожайности от своего тренда с обратным знаком. Значения себестоимости, рассчитанные по модели с учетом тренда себестоимости и колебаний урожайности, приведены в последней графе табл. 9.3:
Как видим, полученные по этой модели уровни себестоимости довольно близки к фактическим.
Другим методом измерения корреляции между временными рядами служит метод корреляции цепных показателей динамики, которые являются константами трендов. Для линейных трендов - это абсолютные цепные изменения. Метод предпочтительно применять для таких рядов, в которых среднее изменение (параметр b) существенно меньше, чем среднее колебание S(t), иначе говоря, показатель K значительно меньше единицы.
Логика применения метода заключается в том, что если колеблемость намного больше изменения тренда за единицу времени, то цепные абсолютные изменения, т.е. разности соседних уровней, в основном состоят из колебаний. В связи с этим корреляция абсолютных изменений будет мало отличаться от корреляции отклонений от тренда. Метод имеет и преимущество: не нужно вычислять тренд, ошибка в выборе типа тренда не влияет на конечный результат. Расчет идет непосредственно по исходным временным рядам. По данным табл. 9.3 имеем:
= +5,57 +5,8; = +0,738 +0,74.
В отличие от отклонений от тренда средняя величина цепных абсолютных изменений не равна нулю. В связи с этим для расчета параметров корреляции необходимо пользоваться полными формулами, а не сокращенной формулой (9.8). Соответствующие суммы квадратов и произведения отклонении от средних приростов приведены в табл. 9.4. Исходя из них имеем:
что почти совпадает с ранее полученной величиной коэффициента корреляции отклонений от трендов.
Если тренды признаков являются экспонентами, то вместо корреляции отклонений от трендов можно применить метод корреляции цепных темпов роста уровней, поскольку именно темпы роста - основной параметр экспоненциальных трендов.
Остаются недостаточно проработанными следующие вопросы: насколько допустима корреляция абсолютных изменений, если тренды имеют другой вид (гиперболический, логистический, логарифмический и т.д.)?; если тренд факторного признака одного типа, а результативного - другого типа? Достаточного практического опыта для убедительного ответа на эти вопросы у авторов нет, они будут благодарны читателям, если кто-то из них предложит свои ответы на эти вопросы. Еще раз, и не последний, авторы подчеркивают, что наука - открытая система, продолжающийся процесс познания, открытия новых «материков» (реже) и «островов» (чаще) в бесконечном океане неведомого.
В заключение напомним, что метод корреляции отклонений от трендов основной, он работает независимо от того, одинаковы типы трендов коррелируемых показателей или нет. Прочие методы - суррогаты, имеющие чаще всего, ограничения по типам трендов.
Таблица 9.4