Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Коломийцева И.В. АиДФХДП Уч. пособ.,2005.doc
Скачиваний:
53
Добавлен:
13.03.2016
Размер:
2.47 Mб
Скачать

2.3 Стратегия, методы и модели линейного регрессионного (стохастического) анализа

Почти в каждой отрасли знания встречаются явления, которые важно изучать в развитии во времени и пространстве. Данные типа временных рядов распространены в самых различных областях человеческой деятельности. В экономике - это ежедневные цены на акции, курсы валют, еженедельные и месячные объёмы продаж, годовые объёмы производства, численность работающих, урожайность сельскохозяйственных культур и т.п.

Познание закономерностей изменений во времени – сложная и трудоёмкая процедура исследования, так как любое изучаемое явление формирует множество факторов, действующих в разных направлениях. С появлением универсальных и специализированных статистических пакетов –STATGRAPHICS, STADIA, SPSS, ЭВРИСТА, STATISTIСAи др. - методы анализа временных рядов стали более доступными и наглядными.

Линейный регрессионный анализ объединяет широкий круг задач, связанных с построением функциональных зависимостей между двумя группами числовых переменных: х1 , х2 , … , хn и у1 , у2 , … , уm . При этом х1 , х2 , … , хn являются независимыми переменными, влияющими на значения у1 , у2 , … , уm . Таким образом, уj называют откликом или, иначе, результативным признаком, а хi называют факторами, влияющими на отклик, или факторными признаками.

Самый простой случай регрессионных задач – это исследование связи между одной независимой переменной х и одной зависимой переменной (откликом) у. Данная задача носит название простой регрессии

В более общем случае задача регрессионного анализа предполагает установление линейной зависимости между группой независимых переменных х1 , х2 , … , хk (где k – порядковый номер переменной, а не номер наблюдения этой переменной) и одномерным откликом у. Эта задача называется множественной регрессией.

Последовательность упорядоченных во времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления, называют временным рядом. Составляющие временной ряд числа – элементы временного ряда – нумеруют в соответствии с номером момента времени, к которому они относятся (например: х1, х2 , х3 и т.д.).

Важнейшим условием правильного формирования временного ряда является сопоставимость уровней, образующих ряд. Уровни ряда должны быть однородны по экономическому содержанию и учитывать существо изучаемого явления и цель исследования.

При анализе показателей в стоимостном выражении следует устранить влияние изменения цен. Для решения этой задачи количество продукции, произведённое в разные периоды, оценивают в ценах одного периода, то есть в сопоставимых.

Чаще всего ставятся следующие цели анализа временных рядов :

  • краткое описание характерных особенностей ряда;

  • подбор статистической модели (моделей), описывающей временной ряд;

  • предсказание будущих значений на основе прошлых наблюдений;

  • управление процессом, порождающим временной ряд.

Обычно при практическом анализе временных рядов последовательно проходят следующие этапы :

  • графическое представление и описание поведения временного ряда;

  • выделение и удаление закономерных составляющих временного ряда, зависящих от времени: тренда, сезонных и циклических составляющих;

  • выделение и удаление низко- и высокочастотных составляющих процесса (фильтрация);

  • исследование случайной составляющей временного ряда, оставшейся после удаления перечисленных выше составляющих;

  • построение (подбор) математической модели для описания случайной

составляющей и проверка её адекватности;

  • прогнозирование будущего развития процесса, представленного временным рядом;

  • исследование взаимодействий между различными временными рядами.

Для решения указанных выше задач используются различные методы:

  • корреляционный анализ позволяет выявить существенные периодические зависимости и их лаги (задержки) внутри одного процесса (автокорреляция) или между несколькими процессами (кросскорреляция);

  • спектральный анализ позволяет находить периодические и квазипериодические составляющие временного ряда;

  • сглаживание и фильтрация предназначены для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний;

  • модели авторегрессии и скользящего среднего применяют для описания и прогнозирования процессов, проявляющих однородные колебания вокруг среднего значения;

  • прогнозирование позволяет на основе подобранной модели поведения временного ряда предсказывать его значения в будущем.

При анализе временного ряда видимую его изменчивость стараются разделить на закономерную и случайную составляющие. Под закономерной (детерминированной) составляющей временного ряда х1, х2 , … , хn понимают числовую последовательность d1 , d2 , … , dn , элементы которой d t вычисляются по определённому правилу как функция времени t . Если мы полностью выявим закономерную составляющую в поведении временного ряда, то оставшаяся часть будет выглядеть хаотично и непредсказуемо. Её обычно называют иррегулярной, или случайной компонентой временного ряда.

Анализ временного ряда обычно начинается с выделения тенденции. Основной тенденцией, или трендом, называется характеристика процесса изменения явления за длительное время, освобождённая от случайных колебаний, то есть плавно изменяющаяся, не циклическая компонента, описывающая чистое влияние долговременных факторов, эффект которых сказывается постепенно

При изучении динамики необходимо четко разделять два её основных элемента – тенденцию и колеблемость. Колеблемостью следует называть отклонения уровней отдельных периодов времени от тенденции динамики (тренда). Например, тенденция динамики урожайности сельскохозяйственных культур связана с прогрессом агротехники, укреплением экономики данного хозяйства, совершенствованием организации и управления производством. Колеблемость урожайности вызвана чередованием благоприятных по погоде и неблагоприятных лет, циклами солнечной активности, колебаниями в развитии вредных насекомых и болезней растений.

Чаще всего главным источником краткосрочных колебаний временного ряда в экономике служит сезонная компонента, которая описывает поведение, изменяющееся регулярно в течение заданного периода (года, месяца, недели и т.п.), и состоит из последовательности почти повторяющихся циклов.

Циклическая компонента временного ряда описывает длительные периоды относительного подъёма и спада и состоит из циклов, которые меняются по амплитуде и протяжённости.

В этом разделе представлены наиболее часто используемые уравнения, описывающие линии тренда. Следует отметить, что из нескольких типов линий, достаточно близко выражающих тенденцию временного ряда, желательно всегда выбирать более простую, поскольку, чем сложнее уравнение линии тренда, тем большее число параметров оно содержит и, следовательно, при равной степени приближения труднее дать надежную оценку этих параметров по ограниченному числу уровней ряда.

Прямолинейный тренд и его свойства. Самым простым типом линии тренда является прямая линия, описываемая линейным (т.е. первой степени) уравнением тренда:

Y(x) i = a + b * x i , (2.50)

где Y(x)i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с номером i ;

а – свободный член уравнения, численно равный среднему выравненному уровню для момента или периода времени, принятого за нача-

ло отсчета, т.е. для х i = 0 ;

b – средняя величина изменения уровней ряда за единицу изменения времени, главный параметр и константа прямолинейного тренда;

x i – фактический уровень временного ряда;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Этот тип тренда подходит для отображения тенденции примерно равномерных изменений уровней: равных в среднем абсолютных приростов или абсолютных сокращений уровней за равные промежутки времени.

Основные свойства тренда в виде прямой линии таковы:

  • равные изменения за равные промежутки времени;

  • если средний абсолютный прирост – положительная величина, то относительные приросты или темпы прироста постепенно уменьшаются;

  • если среднее абсолютное изменение – отрицательная величина, то относительные изменения или темпы сокращения постепенно

увеличиваются;

  • если имеется тенденция к сокращению уровней, а изучаемая величина является по определению положительной, то среднее изменение b не может быть больше среднего уровня a ;

  • при линейном тренде ускорение, т.е. разность абсолютных изменений за последовательные периоды, равно нулю.

Параболический тренд и его свойства. Параболическим называется тренд, описываемый параболой II порядка с уравнением:

Y(x) i = a + b * x i + с * x i 2 , ( 2.51)

где Y(x) i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с номером i ;

а – свободный член уравнения, численно равный среднему выравненному уровню для момента или периода времени, принятого за начало отсчета, т.е. для х i = 0 ;

b – средний за весь период среднегодовой прирост, который изменяется равномерно со средним ускорением, равным 2с ;

x i – фактический уровень временного ряда;

с – константа, главный параметр параболы II порядка;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Парабола II порядка, как уравнение тренда, применяется к тем процессам, которые на некотором, как правило, непродолжительном, этапе развития имеют примерно постоянное ускорение абсолютного прироста уровней.

Основные свойства тренда в форме параболы II порядка таковы:

  • неравные, но равномерно возрастающие или равномерно убывающие абсолютные изменения за равные промежутки времени;

  • парабола, рассматриваемая относительно её математической формы, имеет две ветви: восходящую с увеличением уровней признака и нисходящую с их уменьшением. Но, с точки зрения статистики, трендом, выражающим определённую тенденцию развития, чаще всего можно считать только одну из ветвей: либо восходящую, либо нисходящую;

  • так как свободный член уравнения а как значение показателя в начальный момент (период) отсчета времени, как правило, величина положительная, то характер тренда определяется знаками параметров b и с :

1. при b > 0 и с > 0 имеем восходящую ветвь, то есть тенденцию к ускоренному росту уровней;

2. при b < 0 и с < 0 имеем нисходящую ветвь, то есть тенденцию к ускоренному сокращению уровней;

  1. при b > 0 и с < 0 имеем либо восходящую ветвь с замедляющимся ростом уровней, либо обе ветви параболы - восходящую и нисходящую - если их по существу изучаемого процесса можно считать единой тенденцией;

  2. при b < 0 и с > 0 имеем либо нисходящую ветвь с замедляющимся сокращением уровней, либо обе ветви параболы - нисходящую и восходящую - если их по существу изучаемого процесса можно

считать единой тенденцией;

  • при параболической форме тренда, в зависимости от соотношений между его параметрами, цепные темпы изменений могут либо уменьшаться, либо некоторое время возрастать, но при достаточно длительном периоде рано или поздно темпы роста обязательно начинают уменьшаться, а темпы сокращения уровней при b< 0 ис < 0 обязательно начинают возрастать (по абсолютной величине относительного изменения).

Экспоненциальный тренд и его свойства. Экспоненциальным называется тренд, выраженный уравнением:

Y(x) i = a * k x i (2.52 )

или

Y(x) i = exp ( ln a + ln k * x i ), (2.53 )

где Y(x) i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с номером i ;

а – свободный член уравнения, численно равный среднему выравненному уровню для момента или периода времени, принятого за начало отсчета, т.е. для х i = 0 ;

k – константа, главный параметр экспоненциального тренда – является постоянным (цепным) темпом изменения уровней;

x i – фактический уровень временного ряда;

i – номера моментов или периодов времени, к которым относятся

уровни временного ряда (год, квартал, месяц, дата).

Экспоненциальный тренд характерен для процессов, развивающихся в среде, не создающей никаких ограничений для роста уровня. Из этого следует, что на практике он может развиваться только на ограниченном временном отрезке, так как любая среда рано или поздно создаёт ограничения, любые ресурсы со временем исчерпаемы.

Основные свойства экспоненциального тренда:

  • абсолютные изменения уровней тренда пропорциональны самим уровням;

  • экспонента экстремумов не имеет: при k > 1 тренд стремится к + , при k < 1 тренд стремится к нулю;

  • уровни тренда представляют собой геометрическую прогрессию: уровень периода с номером i = m есть а * k m ;

  • при k > 1 имеем тренд с возрастающими уровнями, причем это возрастание не просто ускоренное, а с возрастающим ускорением и возрастающими производными все более высоких порядков. При k < 1 тренд выражает тенденцию постоянного, но замедляющегося сокращения уровней, причем замедление непрерывно усиливается.

Гиперболический тренд и его свойства. Гиперболическим называется тренд, выраженный уравнением:

Y(x) i = a + b / x i , (2.54)

где Y(x) i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с

номером i ;

а – свободный член уравнения - предел, к которому стремится уровень тренда ;

b – константа, главный параметр гиперболического тренда;

x i – фактический уровень временного ряда;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Гиперболический тренд описывает тенденцию такого процесса, показатели которого со временем затухают, то есть происходит переход от движения к застою.

Основные свойства гиперболического тренда:

  • абсолютный прирост или сокращение уровней, ускорение абсолютных изменений, темп изменения – все эти показатели не являются постоянными;

  • при b > 0 уровни замедленно уменьшаются, отрицательные абсолютные изменения, а также положительные ускорения тоже уменьшаются, цепные темпы изменения растут и стремятся к 100 % ;

  • при b < 0 уровни замедленно возрастают, положительные абсолютные изменения, а также отрицательные ускорения и цепные темпы роста замедленно уменьшаются, стремясь к 100 % .

Логарифмический тренд и его свойства. Логарифмическая форма тренда описывается уравнением:

Y(x) i = a + b * ln x i , (2.55)

где Y(x) i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с

номером i ;

а – свободный член уравнения ;

b – константа, главный параметр логарифмического тренда;

x i – фактический уровень временного ряда;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Логарифмический тренд отражает, так же как и гиперболический тренд, постепенно затухающий процесс изменений. Различие состоит в том, что затухание по гиперболе происходит быстро при приближении к конечному пределу, а при логарифмическом тренде затухающий процесс продолжается без ограничения гораздо медленнее. Нередко такой характер динамики присущ на отдельных этапах развития динамике урожайности или валового сбора определенной сельскохозяйственной культуры в данном регионе, пока новое агротехническое достижение не придаст снова тенденции ускорения.

Основные свойства логарифмического тренда:

  • если b > 0, то уровни тренда возрастают, но с замедлением, а если

b < 0, то уровни тренда уменьшаются, тоже с замедлением;

  • абсолютные изменения уровней по модулю всегда уменьшаются со временем;

  • ускорения абсолютных изменений имеют знак, противоположный самим абсолютным изменениям, а по модулю постепенно уменьшаются;

  • темпы изменения ( цепные) постепенно приближаются к 100 % при

t .

Логистический тренд и его свойства. Логистическая форма тренда (S-образная кривая) описывается следующими уравнениями:

- если диапазон изменения уровней находится в пределах от нуля до единицы, то

1

Y(x) i = ——————— ; (2.56)

а 0+ а1хi

е + 1

- если диапазон изменения уровней ограничен любыми произвольными значениями, то

Y(x) мах - Y(x) мin

Y(x) i = ———————— + Y(x) мin , (2.57)

а 0+ а1хi

е + 1

где Y(x) i – выравненные, т.е. лишенные колебаний, уровни тренда для лет с

номером i ;

Y(x) мах , Y(x) мin – пределы ограничения диапазона изменения уровней временного ряда, устанавливаемые исходя из существа задачи;

а 0 , а 1 – свободные члены уравнения ;

x i – фактический уровень временного ряда;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата).

Логистическая форма тренда подходит для описания такого процесса, при котором изучаемый показатель проходит полный цикл развития , начиная, как правило, от нулевого уровня, сначала медленно, но с ускорением возрастая, затем ускорение становится нулевым в середине цикла, то есть рост происходит по линейному тренду, затем, в завершающей части цикла, рост замедляется по гиперболе по мере приближения к предельному значению показателя.

Основные свойства логистического тренда таковы:

  • при а 0 > 0 и а1 < 0 с ростом номеров периодов времени i получаем логистическую тенденцию роста уровней, причем если нужно начать рост почти от нулевой величины, то а0 должно быть равно примерно 10. Чем больше модуль а1, тем быстрее будут возрастать уровни;

  • при а 0 < 0 и а1 > 0 с ростом номеров периодов времени i получаем логистический тренд со снижением уровней, причем если снижение должно начаться почти от единицы, то а0 должно быть равно примерно -10. Чем больше модуль а1, тем быстрее будут снижаться уровни;

  • при логистическом тренде с возрастающими уровнями показатели динамики изменяются в следующем порядке:

  1. положительные абсолютные изменения нарастают до середины периода, затем уменьшаются;

  2. ускорения сначала возрастают, а после середины периода снижаются, становятся отрицательными, но уменьшаются по модулю;

  3. сумма положительных и отрицательных ускорений приближенно равна нулю (если ряд продлить от до + , то сумма их точно равна нулю);

  4. темпы роста возрастают до конца первой половины ряда, затем снижаются. Если ряд достаточно длинный, то темпы начинаются со 100 % и завершаются на 100 % ;

  • при логистическом тренде со снижающимися уровнями показатели динамики изменяются в следующем порядке:

  1. отрицательные абсолютные изменения по модулю возрастают до середины ряда и снижаются к концу, стремясь к нулю при t = ;

  2. ускорения в первой половине периода отрицательные и по модулю возрастающие, во второй половине периода ускорения положительные и уменьшающиеся в пределе до нуля;

  3. темпы изменений все меньше 100 % , в конце первой половины периода наименьшие, во второй половине возрастающие с замедлением до 100 % в пределе.

Для изучения динамики статистически взаимосвязанных, в основном корреляционно-связанных, признаков используют пространственную многофакторную регрессионную модель:

k

Y(x) i = a +  b j x ij , (2.58)

j= 1

где Y(x) i –результативный признак;

а – свободный член уравнения;

b j – константы, главные параметры уравнения;

x i j – факторные признаки;

i – номера моментов или периодов времени, к которым относятся уровни временного ряда (год, квартал, месяц, дата);

j – номер факторного признака;

k – количество факторных признаков.

Данная модель выражает корреляционную зависимость результативного признака от ряда факторных признаков с коэффициентом детерминации R2ух1хk . С развитием процесса во времени могут изменяться значения факторных признаков, теснота их связи с результативным признаком, а также относительная роль данного комплекса факторов в общей вариации результативного показателя. Коэффициент b j показывает, на какую величину изменяется результативный признак за счет влияния j – того факторного признака при элиминировании влияния остальных факторных признаков.

Пример 2.3. Необходимо установить тенденцию изменения урожайности зерновых культур за ряд лет.

Исходные данные:

Годы

1

2

3

4

5

6

7

8

9

10

Урожайность,

ц /га

42.0

35.2

36.8

27.4

31.9

28.7

45.0

37.8

32.0

36.0

Обработка исходных данных осуществлялась на ЭВМ с применением статистического пакета STATGRAPHICS. В результате было получено следующее уравнение, характеризующее тенденцию изменения урожайности:

У(х) = а + в * х;

У(х) = 36.0 – 0.13 * х,

где У(х) – урожайность, ц /га;

х – порядковый номер года;

а – свободный член;

в – коэффициент регрессии.

Коэффициент регрессии в = - 0.13, следовательно при изменении аргумента х на 1 результативный признак У уменьшается на 0.13 пункта. Таким образом, ежегодное снижение урожайности зерновых культур в данном хозяйстве составляет 0.13 ц / га.