Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1_teoriya-i-metodyi-stat-prog-ya.pdf
Скачиваний:
197
Добавлен:
16.02.2016
Размер:
2.34 Mб
Скачать

44

3. Уравнения линеаризуемых трендов и трендов, сводящихся к модифицированной экспоненте

В практике прогнозирования довольно часто встречаются случаи, когда трудно судить о линейности исходного динамического ряда или когда при графическом изображении его точек нелинейность явно просматривается «на глаз». Тогда есть смысл получить по экспериментальным данным формулу нелинейной парной зависимости. При этом можно рассчитывать, что нелинейная формула даст меньшую остаточную дисперсию Sy2 , вследствие

чего сузится доверительный интервал прогноза. Следует только помнить, что речь идет о зависимости, нелинейной по фактору x (статическая задача прогнозирования) или по фактору t при динамической постановке задачи. По параметрам же тренда зависимость остается линейной.

3.1. Парные регрессии, сводящиеся к линейному тренду

Используя метод наименьших квадратов, можно построить практически любые формы нелинейной парной связи. Для этого используют линеаризующие преобразования, так как только линейные по параметрам функции восстанавливаются с помощью МНК.

Широко распространены два вида преобразований: натуральный логарифм ln и обратное преобразование I/t. При этом, очевидно, возможно преобразование как зависимой переменной y, так и независимой переменной t(x) или одновременно той и другой.

В табл. 3.1. приведены восемь часто встречающихся преобразований парных зависимостей, полученных комбинацией из индивидуальных преобразований зависимой переменной у и независимой переменной t. Качество прогнозирования проверяют на основе уравнения

ˆy′ = a′+bt .

45

Таблица 3.1. Функции и линейные преобразования

 

Функция

 

 

Линеаризующие

 

 

 

 

преобразования

 

 

 

 

 

 

 

 

 

Преобра-

Выражения

Название

Уравнение

 

 

зование

для величин

переменных

 

a и b

 

 

 

 

 

 

 

 

 

 

 

 

y

t

a

b

 

 

 

 

 

1

2

3

 

4

5

6

Линейная

ˆyt = a +bt

y

 

t

 

a

 

b

Экспонен-

ˆyt = aebt

 

 

 

 

циальная

ln y

t

ln a

b

(простая)

 

 

 

 

 

Степенная

ˆyt = atb

ln y

ln t

ln a

b

Гиперболи-

ˆyt = a +

b

 

1

 

b

ческая

y

a

 

t

 

t

 

1 типа

 

 

 

 

Гиперболи-

ˆyt =

1

1

 

 

 

ческая

t

a

b

a +bt

y

2 типа

 

 

 

 

Гиперболи-

ˆyt′ =

1

1

1

 

 

ческая

 

y

t

b

a

a +bt

3 типа

 

 

 

Вид кривой

7

b

1

a

b>0 b<0

b<0

b>0

b>0

a

b<0

b>0

b<0

1/b b>0

b<0 a/b

46

Окончание табл. 3.1

Логариф-

ˆyt

= a +b ln t

y

ln t

a

b

 

 

a

 

 

 

 

 

 

мическая

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

Обратно-

 

 

 

1

 

1

 

 

 

 

 

b>0

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆyt

=

 

 

ln t

a

b

 

 

b<0

 

 

логариф-

 

 

 

y

 

 

 

 

a +bln t

1

 

 

 

 

 

 

 

 

 

 

 

 

 

мическая

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a/b>ln t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆyt = ae

a +b / t

 

1

 

 

 

 

ea

 

 

 

ln y

a

b

 

 

b>a

 

 

S-образная

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b<-a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

После вычисления коэффициентов aи bпо методу наименьших квадратов выполняют обратные преобразования, то есть по aи bопределяют a и b.

Так, например, простая экспоненциальная кривая (экспонента) определяется уравнением

ˆyt = a ebt ,

где e – основание натурального логарифма.

Это уравнение можно переписать в другом виде:

ˆyt = a e a′+bt , где a′ = ln a

или ˆyt = a(b)t , где b′ = eb .

От обеих частей исходного уравнения возьмем натуральный логарифм. Получим

ln ˆyt = ln a +bt ln e

или

ˆ

=

a

+

ˆ

=

ˆ

=

.

y

 

 

 

 

bt(y

 

 

ln yt , a

 

 

ln a)

47

Параметры aи b определим МНК и, преобразуя a = anti ln(a), снова перейдем к исходному уравнению.

Для конкретизации примера используем исходные данные, отражающие изменения количества типовых объектов (табл. 2.1), с учетом линеаризующих преобразований составим новую таблицу (табл. 3.2).

Таблица 3.2. Исходные данные для определения параметров

экспоненциальной прогнозной модели

T, год

1973

1975

1977

1979

1981

1983

1985

t

1

2

3

4

5

6

7

yt, шт.

227

219

209

197

193

200

199

yt′ = ln yt

6,425

5,389

5,342

5,283

5,263

5,298

5,293

ytt

5,425

10,778

16,027

21,133

26,313

31,790

37,053

T, год

1987

1989

 

1991

1993

 

1995

1997

1999

t

8

9

 

10

11

 

12

13

14

yt, шт.

197

191

 

177

175

 

167

193

144

yt′ = ln yt

5,283

5,252

 

5,176

5,165

 

5,118

5,263

4,970

ytt

42,266

47,270

 

51,761

56,813

 

61,416

68,415

69,577

n

 

 

n

 

 

n

 

n

 

yt′ = 73,520 ;

 

ytt

= 546,037 ;

ti =105;

ti2 =10,15.

t =1

 

 

t =1

 

 

i =1

 

i =1

 

В соответствии с системой уравнений (2.3) систему нормальных

 

уравнений запишем в виде

 

 

 

 

 

 

 

 

 

73,520

=

a14

+b 105 ;

 

 

 

 

 

546,037 =

a105 +b 1015 .

 

 

Решение этой системы дает

 

 

 

 

 

 

 

b =

14 546,037 105 73,520

= −0,024 ;

 

 

14 1015 1052

a′ = 141 (73,520 + 0,024 105)= 5,431; a = anti ln 5,431 = 228,378 .

Уравнение регрессии,
а точечный прогноз на 2005

48

следовательно, имеет вид

ˆyt = 228,378 e0,024t ,

г. (tk =17 )

ˆy1995 = 228,378e0,024 17 153 объекта.

Для линеаризованных выражений также можно найти среднеквадратические ошибки оценок параметров и значений ˆyt . Отсюда можно определить и среднеквадратическую погрешность прогноза. Воспользуемся в чисто иллюстративных целях данными нашего примера, в котором мы оценили параметры экспоненты. Определим теперь доверительные интервалы для нее.

Поскольку уравнение содержит два оцениваемых параметра, то число степеней свободы при расчете квадратического отклонения составит 14–2=12; необходимые для расчета квадратического отклонения разности между фактическими и расчетными значениями логарифмов уровней приведены в табл. 3.3.

Сумма квадратов отклонений (в логарифмах) равна 0,047. В соответствии с выражением (2.5)

Sy2 =

n (ln yt ln ˆyt )2

= 0,047 = 0,004

 

 

i =1

 

 

 

n υ

 

 

12

 

 

и

 

 

 

 

 

 

Sy = 0,063.

 

 

 

 

= 7,5 , то

Так как прогноз осуществлялся для tk =17 (на 1995 г.), t

n (ti t

)2 227,5

(см. табл. 3.2)

i=1

 

 

 

Sп = 0,063 I + I / 14 + (17 7,5)2 = 0,092 . 227,5

yпред

49

Таблица 3.3. Расчет отклонений от экспоненциального тренда

t

1

2

3

4

5

6

7

yt

227

219

209

197

193

200

199

ln yt

5,425

5,389

5,342

5,283

5,263

5,298

5,293

ln ˆyt

5,404

5,380

5,356

5,332

5,308

5,284

2,260

ln yt ln ˆyt

0,021

0,009

–0,014

–0,049

–0,045

0,014

0,033

t

8

9

 

10

 

11

 

12

13

14

yt

197

191

 

177

 

175

 

167

193

144

ln yt

5,283

5,252

5,176

 

5,165

 

5,118

5,263

4,970

ln ˆyt

5,236

5,212

5,188

 

5,164

 

5,140

5,116

5,092

ln yt ln ˆyt

0,047

0,040

–0,012

0,001

–0,022

0,147

–0,122

Для данного примера t-статистика Стьюдента равна 1,78. Таким образом,

= 0,092 1,78.

 

 

 

 

 

 

 

 

 

Доверительный интервал определится следующим выражением:

 

 

 

 

 

 

± 0,092 1,78

 

,

 

 

 

 

anti ln ln y

2000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

что будет соответствовать 129-180 объектам.

Часто при прогнозировании тенденций развития техники необходимо определять предельные значения изучаемых переменных, изменяющихся по экспоненте. Такие величины имеют начальные значения y0 и предел, к

которому стремятся в бесконечности, (асимптоту).

Доказано, что финишные участки экспоненциальной кривой хорошо аппроксимируются гиперболической зависимостью

y = t(a + bt).

Разделив числитель и знаменатель правой части этого выражения на t, нетрудно заметить, что

y =

 

 

1

, при t → ∞ y =

 

 

1

yпред =1 b .

a

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+b

 

 

+b

 

 

t

 

 

t

 

 

50

Параметр b определяется методом наименьших квадратов после линеаризующей замены переменных согласно табл. 3.1.

3.2. Парные регрессии, сводящиеся к модифицированной экспоненте

Все ранее рассмотренные кривые описывают ситуации, когда коэффициент наклона касательной либо возрастает, либо убывает. Однако иногда встречаются данные (это касается в первую очередь техникоэкономических процессов), которые необходимо описывать кривыми, имеющими точку перегиба, то есть точку, где рост наклона касательной сменяется падением или, наоборот, падение сменяется ростом. При этом динамика явления такова:

вначале рост довольно медленный, затем он убыстряется;

промежуточный период роста сменяется третьим периодом;

третий период – уменьшение роста и приближение к уровню насыщения.

Широко распространенными кривыми, обладающими точкой перегиба и наиболее точно описывающими процессы полного цикла, являются так называемые S-образные кривые, среди которых наибольшее применение получили логистическая кривая (кривая Перла) и кривая Гомпертца.

Кривая Гомпертца и логистическая кривая могут быть получены из другой кривой, известной как модифицированная экспонента, тем же способом, каким были получены из обычной линейной регрессии кривые, рассмотренные ранее.

Модифицированная экспонента задается тремя параметрами (вместо двух параметров при линейной зависимости), и ее уравнение отличается от простой экспоненты:

y

t

= aebt

или при eb = c

y = act

 

 

 

t

лишь дополнительными слагаемыми. Таким образом,

51

y

t

= b + act

или

y = a +bct .

 

 

 

t

Эта функция сама по себе не имеет точки перегиба и в записи

yt = a +bct имеет горизонтальную асимптоту y = a , ее график стремится к асимптоте при t →∞ либо при t → −∞, но никогда ее не пересекает.

Обычная процедура наименьших квадратов непосредственно к модифицированной экспоненте неприложима, однако существует и эффективный метод определения параметров этой кривой.

Теория, лежащая в основе описываемого ниже метода определения параметров модифицированной экспоненты, в пособии не рассматривается, однако с ней можно ознакомиться по другим источникам. Следуя этому методу, сначала определяют параметр с, а затем параметры a и b.

Приведем формулы для определения параметров модифицированной экспоненты в порядке их вычисления:

 

 

n1

 

n1

n1

 

 

 

c =

(n 1)yt yt +1

yt yt +1

 

 

 

t =1

 

t =1

t =1

;

 

 

 

 

n1

n1

2

 

 

 

 

 

 

 

 

 

(n 1)yt2

yt

 

 

 

 

 

 

t =1

t =1

 

 

 

 

n

n

n

 

n

n

 

nct yt ct yt

; a =

yt bct

b =

t =1

t =1 t =1

t =1

t =1

.

 

 

 

n

 

n

2

 

n

 

 

 

nc2t

ct

 

 

 

 

 

t =1

t =1

 

 

 

 

 

Втабл. 3.4 и ниже приводятся вычисления, необходимые для нахождения параметров a, b и c модифицированной кривой, для примера, рассмотренного в предыдущих разделах.

Врезультате из приведенных уравнений получим

c =

13 483938

2554 2461

= 0,69397 ;

13 501212

(2544)2

b =

14

477,449512,25402 2688

= 78,9289 ;

 

14 0,92895 (2,25402)2

 

 

52

 

a =

2688 78,9288 2,2540

=179,29235 .

14

 

 

Таким образом, уравнение модифицированной экспоненты будет иметь

вид

ˆyt =179,292 + 78,929 0,694t .

Модифицированная экспонента, как отмечалось, служит базовой кривой, на основе которой с помощью некоторых преобразований получаются используемые чаще логистическая кривая и кривая Гомпертца.

Логистическая кривая может задаваться уравнением

ˆyt =1(a +bct ).

Произведем обратное преобразование левой и правой частей этого

уравнения:

ˆyt

=

a

+

bc

yt

=

1 yt

.

 

 

 

t , где ˆ

ˆ

Последнее уравнение имеет вид модифицированной экспоненты, поэтому ее параметры с, b и а можно найти по приведенным ранее формулам.

Логистическая кривая имеет S-образную форму с точкой перегиба, равной

tп = (1ln c) ln(ab).

Значение ˆy в точке перегиба равно

ˆytп =12a .

Кривая Гомпертца несимметрична и определяется уравнением

ˆyt = abct .

Если логарифм параметра b отрицателен, то верхний предел для ординаты равен a, нижний равен 0; если он положителен, то асимптота проходит ниже кривой.

Возьмем от обеих частей уравнения натуральный логарифм, получим

ln ˆyt = ln a + ct ln b ,

53

что приводит к виду

ˆyt′ = a′+ bct , где ˆyt′ = ln yt ; a′ = ln a ; b′ = lnb.

Последнее уравнение имеет вид модифицированной экспоненты, поэтому параметры a, bи c могут быть получены по известным формулам.

Следует отметить, что на практике при оценивании параметров рассматриваемых кривых часто прибегают к упрощенным методам оценивания, в частности к методу трех точек.

Допустим, логистическая кривая задана в виде

ˆyt

=

 

a

 

+ bect

 

1

и нет полного ряда данных. Тогда для оценки параметров можно воспользоваться методом трех точек. Причем подбор параметров производят так, чтобы кривая прошла через некоторые заданные точки: уровни ряда динамики в начале и конце ряда. Непременным условием является равенство расстояний между этими уровнями. Итак, нам необходимо провести логистическую кривую через три точки, соответствующие уровням y0 , y1 и y2 . Пусть расстояние между y0 и y1 равно n единицам времени. Тогда,

используя соотношение (3.1), получим

 

 

 

1

 

 

=

1

(1+b);

1

=

1

(1+becn );

 

 

y

0

 

 

a

y

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

Определим теперь разности d1 и d2 :

d1

=

 

1

 

 

1

=

b

(1enc );

d2 =

 

y

 

 

 

y

 

 

 

 

 

0

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

Отсюда d1 = enc .

d2

Таким образом c = 1n (ln d1 ln d2 ).

 

1

=

 

1

(1 + be c2n ).

 

 

 

 

 

 

y2

 

 

a

 

 

 

1

1

 

 

=

b

enc (1enc )..

 

y

 

 

 

 

y

2

 

 

a

1

 

 

 

 

 

 

 

54

d 2

Далее определим значение выражения 1 .

d1 d2

После ряда преобразований получим

 

 

 

 

 

 

 

 

d 2

 

 

 

b

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

=

 

=

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

y0

a

 

 

 

 

 

 

d1 d2

 

 

 

 

 

 

 

 

Откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

=

1

 

 

d12

 

a =

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

.

 

 

a

y0

 

d1 d2

 

1

 

d12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y0

 

d1 d2

 

 

 

Наконец, исходя из

 

1

 

 

=

1

(1 +b), получим b =

a y0

.

 

y0

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y0

Для иллюстрации допустим, что нам необходимо провести

логистическую кривую через точки: y0

=12,9, y1 = 62,1 и y2 =152,7 .

Интервалы y0 y1 и y1 y2 равны шести единицам времени, то есть n = 6.

На основе этих данных получим

1

 

= 0,0775;

 

1

 

 

= 0,0161;

 

 

 

1

= 0,0065

;

 

y

 

 

 

 

y

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

y

2

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d1 = 0,0614;

 

d2 = 0,0095;

 

 

 

 

 

 

c =

1

(ln 0,0614 ln 0,0095) 0,31;

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

= 0,0775

0,06142

0,0095 0,0048.

 

 

 

 

 

a

0,0614

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a = 208,2; b =

 

208,2 0,0775

= 2682.

 

 

 

 

 

 

 

0,0775

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆyt

=

 

 

208,2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 + 2682e0,31t

 

 

 

 

 

 

 

55

Таблица 3.4. Исходные данные и вычисления, необходимые для

определения параметров модифицированной экспоненты

Т

t

 

 

yt

yt +1

yt yt +1

yt2

ct

ct yt

c2t

ˆyt

1973

1

227

 

 

219

49713

51529

0,69397

157,53119

0,48159

234

1975

2

219

 

 

209

45771

47961

0,48159

105,46916

0,23193

217

1977

3

209

 

 

197

41173

43681

0,33421

69,85031

0,11170

206

1979

4

197

 

 

193

38021

38809

0,23193

45,69082

0,05379

198

1981

5

193

 

 

200

38600

37249

0,16095

31,0,6424

0,02591

192

1983

6

200

 

 

199

39800

40000

0,11170

22,33953

0,01248

188

1985

7

199

 

 

197

39203

39601

0,07751

15,42545

0,00601

185

1987

8

197

 

 

191

37627

38809

0,05379

10,59721

0,00289

183

1989

9

191

 

 

177

33807

36481

0,03733

7,1016

0,00139

182

1991

10

177

 

 

175

30975

31329

0,02591

4,58543

0,00067

181

1993

11

175

 

 

167

29225

30625

0,01798

3,14619

0,00032

181

1995

12

167

 

 

193

32231

27889

0,01248

2,08355

0,00016

180

1997

13

193

 

 

144

27792

37249

0,00866

1,67104

0,00007

180

1999

14

 

 

144

 

 

 

 

 

0,00601

0,86523

0,00004

179

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2544

 

2461

483938

501212

 

 

 

 

t=1

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,25402

477,44951

0,92895

 

 

2688

 

 

 

 

 

t=1

 

 

 

 

 

 

 

 

 

 

 

 

 

Как было показано, непременным условием применения данного метода является равенство расстояний по оси времени между выбранными для подбора кривой точками. Если это условие не соблюдено, то подбор кривой также может быть осуществлен, однако для этого необходима дополнительная информация, а именно оценка значения асимптоты. Значение асимптоты можно в ряде случаев оценить или получить вне данного статистического наблюдения, например исходя из существа развития самого изучаемого явления и различного рода ограничений, сопутствующих ему.

Пусть оценка параметров логистической кривой производится на основе заданного значения асимптоты а* и ординат двух первых точек кривой. Тогда

b = a* y0 ; y0