Скачиваний:
118
Добавлен:
20.04.2015
Размер:
5.62 Mб
Скачать

9.3. Корреляция между временными рядами: сущность, ограничения

Предполагается, что читатель знаком с теорией корреляции в пространственных совокупностях и ее показателями, которые здесь используются. Корреляция временных рядов применяет­ся:

• взамен пространственной корреляции, ввиду отсутствия однородной совокупности или данных о таковой. Например, при изучении связи между средним душевым доходом в стране и душевым потреблением картофеля. Совокупность стран явно неоднородна, не везде потребляется картофель, единственная возможность измерить связь - по данным той же страны за ряд лет;

• при изучении взаимодействующих процессов, например при изучении связи между урожайностью и колебаниями сол­нечной активности. Изучать эту связь по пространственной со­вокупности вообще невозможно: для всех регионов на Земле показатели солнечной активности одинаковы;

• там, где следует применять пространственную корреляцию. Например, дипломник проходил практику в отдельном колхо­зе, на предприятии, а не в районе. У него нет данных по сово­купности хозяйств о внесении удобрений и об урожайности, он берет данные колхоза за 7-11 лет и по ним измеряет связь уро­жайности с дозой удобрений, получая, как правило, низкий ко­эффициент корреляции или даже отрицательный, потому что урожайность разных лет колеблется вовсе не из-за различия доз удобрения, а совсем из-за других причин. Это просто суррогат настоящей пространственной корреляции, к которому прибе­гать не рекомендуется.

Корреляция между двумя (для простоты возьмем два) при­знаками означает, что если величина одного из них больше сред­ней по совокупности, то и величина другого в основном тоже больше его средней (прямая связь) или же в основном меньше его средней (обратная связь). Но если оба признака имеют оди­наково направленные тренды, то уровни лет после середины периода, как правило, больше средних величин или, при трендах к снижению, оба признака имеют уровни меньше средних. Выходит, что в динамике между любыми признаками, имеющи­ми тенденцию изменения, всегда есть связь: либо прямая (оба тренда в одном направлении), либо обратная (тренды в разных направлениях). Результат абсурдный. В любой развитой стране в 1970-1990 гг. рос уровень производства компьютеров. Одно­временно росло число инфицированных ВИЧ-инфекцией и больных СПИД. Но при очень высокой корреляции уровней обоих рядов никакой реальной связи процессов нет. Это один из видов ложной корреляции. Как же отличить ложную корре­ляцию от истинной? Конечно, прежде всего, как и при изучении связей в пространственной совокупности, нужно обосновать связь по существу, объяснить ее причинный механизм. Эта за­дача не статистическая, поэтому в данном учебнике не рассмат­ривается. Она решается специалистом в той сфере знаний, которая изучает объект, процесс, - агрономом, инженером, эко­номистом, социологом, биохимиком, астрономом и т.д. Без при­чинного обоснования лучше не начинать измерение связи в динамике.

Но даже и после такого обоснования остается открытым вопрос: при наличии одинаково направленных трендов двух причинно-связанных признаков не преувеличится ли теснота связи за счет трендов? Если, например, в стране растет произ­водство и применение минеральных удобрений, растет и уро­жайность сельскохозяйственных культур, но последняя растет не только по причине увеличения применения удобрений, а также и за счет других факторов - селекции новых сортов, мелиорации, орошения, механизации производства, роста экономической заинтересованности фермеров и др. А при коррелировании уровней урожайности и доз удобрений за 20-25 лет прогресс всех факторов урожайности будет отнесен на дозу удобрений. Получится коэффициент детерминации, превыша­ющий 50 или даже 70%, и где гарантия, что к истинной корре­ляции и здесь не примешана ложная? Такой гарантии нет.

Могут возразить: «А разве не может так случиться, что и в пространственной совокупности предприятий, у тех из них, ко­торые вносят большие дозы минеральных удобрений, одно­временно и семена лучше, и сельскохозяйственные машины, и кадры более подготовлены, и экономика сильнее?» Да, это воз­можно, но именно лишь возможно, как возможно и несовпаде­ние факторов, влияющих на урожайность. А параллельная тенденция динамики факторов во времени - это не просто воз­можность, а в 90% стран и регионов - достоверный факт. Так что примесь ложной корреляции в пространственных совокупностях намного меньше, чем при коррелировании временных рядов. И, следовательно, если есть возможность изучать, из­мерять, моделировать связь результативного признака с его факторами не по рядам динамики, а в пространственной сово­купности, это обязательно следует делать.

Проблема ложной корреляции почти целиком снимается, если причинная связь обоснована не столько между тенденция­ми динамики, сколько между колебаниями факторного и ре­зультативного признаков. Например, колебания урожайности во влагонедостаточных регионах, например, таких, как Орен­бургская область, причинно связаны не с какой-либо тенденци­ей изменения суммы осадков, а с ее колебаниями в отдельные годы. К тенденции же роста урожайности осадки никакого от­ношения (причинной связи) не имеют. Снимается ложная корре­ляция тем, что колебания других факторов, влияющих на урожайность, - экономических, организационных - не связаны или слабо связаны с колебаниями осадков. Тенденции факторов связаны часто, колебания - почти никогда. Поэтому связь меж­ду колебаниями одного фактора с результативным показате­лем (его колебаниями) почти всегда свободна от ложной корреляции, наведенной другими факторами.

В последующих разделах данной главы в основном будут рассматриваться корреляция между колебаниями признаков, а также методики ее измерения и моделирования. Что же касается измерения связи между тенденциями, между самими уровнями временных рядов, включающих тенденцию, а не только колеба­ния, то эта проблема не может считаться решенной. Некоторые указания читатели учебника могут найти в разделе о смешан­ных прогностических моделях (гл. 10). Излагаемые здесь мето­дики решают только ограниченный класс задач - измерение связи между колебаниями факторного (факторных) признака и колебаниями результативного признака.

Строго говоря, это жесткое ограничение относится и к про­странственной корреляции в том смысле, что и в ней измеряет­ся связь вариации результативного признака с вариацией фактора. Например, за счет вариации дозы минеральных удоб­рений объясняется 38% вариации урожайности пшеницы между хозяйствами области (r 2 = 0,38), а не 38% уровня урожайности, как иногда неверно считают.