Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бережная_Матметоды моделирования эк cистем

.pdf
Скачиваний:
211
Добавлен:
29.03.2015
Размер:
8.86 Mб
Скачать

2)формирование перечня факторов и их логический анализ;

3)сбор исходных данных и их первичная обработка;

4)спецификация функции регрессии;

5)оценка функции регрессии;

6)отбор главных факторов;

7)проверка адекватности модели;

8)экономическая интерпретация;

9)прогнозирование неизвестных значений зависимой пере­ менной.

Рассмотрим подробнее содержание этапов.

A. Априорное исследование экономической проблемы. В соответс вии с целью работы на основе знаний макро-и микроэкономики конкретизируются явления, процессы, зависимость между которы­ ми подлежит оценке. При этом подразумевается прежде всего чет­ кое определение экономических явлений, установление объектов и периода исследования.

На этом этапе исследования должны быть сформулированы экономически осмысленные и приемлемые гипотезы о зависимос­ ти экономических явлений.

Б. Формирование перечня факторов и их логический анализ. Для определения наиболее разумного числа переменных в регрессион­ ной модели прежде всего ориентируются на соображения профес­ сионально-теоретического характера. Исходя из физического смыс­ ла явления, производят классификацию переменных на зависимую

иобъясняющую.

B. Сбор исходных данных и их первичная обработка. При построе­ нии модели исходная информация может быть собрана в трех видах:

• динамические (временные) ряды;

пространственная информация — информация о работе не­ скольких объектов в одном разрезе времени;

сменная табличная форма. Информация о работе несколь­ ких объектов за разные периоды.

Объем выборки зависит от числа факторов, включаемых в мо­ дель с учетом свободного члена. Для получения статистически зна­ чимой модели требуется на один фактор объем выборки, равный 1 = 5 -^ 8 наблюдений. Например, если в модель включаются три фактора, то минимальный объем выборки

Пшп = 5 . (/W + Л) = 5 . (3 + 1) = 20,

где т — число факторов, включаемых в модель; п — число свободных членов в уравнении.

Если в квартальном разрезе собирать данные, то надо их соби­ рать за 5 лет [20/4].

150

г. Спецификация функции регрессии. На данном этапе исследова­ ния дается конкретная формулировка гипотезы о форме связи (ли­ нейная или нелинейная, простая или множественная и т. д.). Для этого используются различные критерии ддя проверки состоятель­ ности гипотетического вида зависимости. На этом этапе проверя­ ются предпосылки корреляционно-регрессионного анализа.

Д. Оценка функции регрессии. Здесь определяются числовые зна­ чения параметров регрессии и вычисление ряда показателей, ха­ рактеризующих точность регрессионного анализа.

Е. Отбор главных факторов. Выбор факторов - основа для по­ строения многофакторной корреляционно-регрессионной модели.

На этапе формирования перечня факторов и их логического анализа собираются все возможные факторы, обычно более 20-30 факторов. Но это неудобно для анализа, и модель, включающая 20—30 факторов, будет неустойчива. Неустойчивость модели нахо­ дит выражение в том, что в ней изменение некоторых факторов ве­ дет к увеличению у вместо снижения ;;.

Мало факторов — тоже плохо. Это может привести к ошибкам при принятии решений в ходе анализа модели. Поэтому необходи­ мо выбирать более рациональный перечень факторов. При этом проводят анализ факторов на мультиколлинеарность.

Анализ и способы снижения влияния мультиколлинеарности на значимость модели. Мультиколлинеарность — попарная корреляци­ онная зависимость между факторами.

Мультиколлинеарная зависимость присутствует, если коэффи­ циент парной корреляции г^у = > 0,70 -г- 0,80.

Отрицательное воздействие мультиколлинеарности состоит в следующем:

1)усложняется процедура выбора главных факторов;

2)искажается смысл коэффициента множественной корреля­ ции (он предполагает независимость факторов);

3)усложняются вычисления при построении самой модели;

4)снижается точность оценки параметров регрессии, искажает­ ся оценка дисперсии.

Следствием снижения точности является ненадежность коэф­ фициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объяс­ няющей переменной на зависимую переменную.

Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выбор­ ки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы крите­ рия значимости, поэтому применение самих критериев становится

151

также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.

Для измерения мультиколлинеарности можно использовать ко­

эффициент множественной детерминации

 

Д = R \

(5.23)

где R ~ коэффициент множественной корреляции.

 

При отсутствии мультиколлинеарности факторов

 

т

 

JX=lclyj,

(5.24)

у=1

где dyj — коэффициент парной детерминации, вычисляемый по формуле

dyj = r^yj,

(5.25)

где Kyj — коэффициент парной корреляции между у-м фактором и зависи­ мой переменной у.

При наличии мультиколлинеарности соотношение (5.24) не со­ блюдается. Поэтому в качестве меры мультиколлинеарности ис­ пользуется следующая разность:

M = JX'-idyj.

(5.26)

у=1

 

Чем меньше эта разность, тем меньше мультиколлинеарность. Для устранения мультиколлинеарности используется метод исклю­ чения переменных. Этот метод заключается в том, что высоко корре­ лированные объясняющие переменные (факторы) устраняются из рефессии и она заново оценивается. Отбор переменных, подлежа­ щих исключению, производится с помощью коэффициентов пар­ ной корреляции. Опыт показывает, что если | г^у | > 0,70, то одну из переменных можно исключить, но какую переменную исключить из анализа, решают исходя из управляемости факторов на уровне предприятия.

Обычно в модели оставляют тот фактор, на который можно разработать мероприятие, обеспечивающее улучшение значения этого фактора в планируемом году. Возможна ситуация, когда оба мультиколлинеарных фактора управляемы на уровне предприятия. Решить вопрос об исключении того или иного фактора можно толь­ ко в соответствии с процедурой отбора главных факторов.

152

Отбор факторов не самостоятельный процесс, он сопровожда­ ется построением модели. Принятие решения об исключении фак­ торов производится на основе анализа значений специальных ста­ тистических характеристик и с учетом управляемости факторов на уровне предприятия.

Процедура отбора главных факторов. Эта процедура обязательно включает следующие этапы:

1. Анализ факторов на мультиколлинеарностъ и ее исключение.

Здесь производится анализ значений коэффициентов парной кор­ реляции r^y между факторами Х/ и Xj.

2 Анализ тесноты взаимосвязи факторов (х) с зависимой пере­ менной (у).

Для анализа тесноты взаимосвязи л: и у используются значения коэффициента парной корреляции между фактором и функцией {г^^). Величина г^^ определяется на ЭВМ и представлена в корре­ ляционной матрице вида (табл. 5.1).

Таблица 5.1

Корреляционная матрица

'

 

переменной

Х\

Х2

хз

У

 

 

 

 

 

^ 1

1

^XiXi

Гг|Хз

^XiX„

^ХхУ

1

^2

^х^\

1

'jfa^i

^Х^т

^xiy

 

Хз

*'хух^

^хухг

1

^XiX„

^ХзУ

 

''xmXi

^Х^2

^х^з

i

^х„у

 

У

Гух,

^УХг

Гухз

f-yx^

1

 

 

Факторы, для которых г^^ = О, т. е. не связанные с у, подлежат исключению в первую очередь. Факторы, имеющие наименьшее значение г^^, могут быть потенциально исключены из модели. Во­ прос об их окончательном исключении решается в ходе анализа других статистических характеристик.

3. Анализ коэффициентов Р факторов, которые потенциально мо­ гут быть исключены.

Коэффициент (3 учитывает влияние анализируемых факторов на j^ с учетом различий в уровне их колеблемости. Коэффициент Р показывает, насколько сигм (средних квадратических отклоне­ ний) изменяется функция с изменением соответствующего аргу­ мента на одну сигму при фиксированном значении остальных ар­ гументов:

153

^k=ci,^,

(5.27)

Су

где (3^ — коэффициент р к-го фактора;

Gx^ - среднее квадратическое отклонение А;-го фактора; Gy — среднее квадратическое отклонение функции; Of^ — коэффициент регрессии при к-м факторе.

Из двух факторов Х/ и Xj может быть исключен тот фактор, ко­ торый имеет меньшее значение р.

Допустим, исключению подлежит один из мультиколлинеарных факторов X/ или Xj. Оба фактора управляемы на уровне предприя­ тия, коэффициенты регрессии а^ и aj статистически значимы. Фак­ тор Х( более тесно связан с у, т. е. г^у > г^х,, но при этом Р^.. < Рд.. В этом случае обычно исключению подлежит фактор Xj. ' ^

4. Проверка коэффициентов регрессии на статистическую значи­ мость.

Проверка может быть произведена двумя способами:

• проверка статистической значимости а^- по критерию Стьюдента проводится по следующей формуле

h^-^^

(5.28)

где Qj^ — коэффициент регрессии при к-м факторе; Sa — стандартное отклонение оценки параметра ai^\

Число степеней свободы статистики /^ равно / = « - W/ - 1,

где т - количество факторов, включенных в модель.

Значение /, вычисляемое по (5.28), сравнивают с критическим значением /^^, найденным по приложению 1 при заданном уровне значимости а и числе степеней свободы/(двухсторонняя критиче­ ская область).

Если tf^ > /уос, то Of^ существенно больше О, а фактор Xf^ оказыва ет существенное влияние на у. При этом фактор Xf^ оставляем в мо­ дели. Если t/^ < tf^^, то фактор исключаем из модели;

• проверка статистической значимости aj^ по критерию Фишера —

\ 2

=лt\

(5.29)

'аи

 

 

где Р" — многомерный аналог критерия Стьюдента.

' Ферстер Э., Ренц Б, Методы корреляционного и регрессионного ана­ лиза. — М.: Финансы и статистика, 1983.

154

Число степеней свободы статистики Fj^ следующее:/! "^ Ь /2 = « - W/ - 1. Значение Fj^, вычисляемое по формуле (5.29), срав­ нивают с критическим значением ^/а> найденным по приложе­ нию 2, при заданных уровне значимости а и числе степеней свобо­ ды/i, Л-

Если Fj^ > Ffff^, то ai^ - существенно больше О, а фактор х^ ока­ зывает существенное влияние на у. При этом фактор Xj^ оставляем в модели. Если Fj^ < Fj-f^, то фактор исключаем из модели.

5, Анализ факторов на управляемость,

В ходе логического анализа на основе экономических знаний исследователь должен сделать вывод: можно ли разработать орга­ низационно-технические мероприятия, направленные на улучше­ ние (изменение) выбранных факторов на уровне предприятия. Ес­ ли это возможно, то данные факторы управляемы. Неуправляемые факторы на уровне предприятия могут быть исключены из модели. Например, из двух факторов Xi - средняя техническая скорость ав­ томобилей и ^2 - время погрузки-разгрузки на одну ездку при ра­ венстве или близких по значению таких характеристик, как г^у и г^у, Р^ и Р^ , исключению подлежит Xj. На уровне АТП практиче­ ски невозможно повлиять на значение технической скорости, ко­ торая зависит в основном от климатических условий и величины транспортного потока.

6, Строится новая регрессионная модель без исключенных факто­ ров. Для этой модели определяется коэффициент множественной детерминации Д,

7, Исследование целесообразности исключения факторов из моде­ ли с помощью коэффициента детерминации.

Прежде чем вынести решение об исключении переменных из анализа в силу их незначимого влияния на зависимую перемен­ ную, производят исследования с помощью коэффициента детер­ минации.

В первой регрессий содержится т объясняющих переменных, во второй - только часть из них, а именно т^ объясняющих перемен­ ных. При этом т = mi -^ mi, т. е. во вторую регрессию мы не вклю­ чили /«2 объясняющих переменных. Теперь следует проверить, вно­ сят ли совместно эти /«2 переменных существенную долю в объясне­ ние вариации переменной у. Для этого используется статистика

{JX^-JX^^y{n-m-\)

 

{т-тМ^-JX^)

'

<5.30)

которая имеет /'-распределение cfi= т -

mi= mjnfj-

п - т - I

степенями свободы. Здесь Д„ означает коэффициент детерминации

155

рефессии с т объясняющими переменными, а Д„ — коэффициент детерминации регрессии с mi-факторами.

Разность (Д„ - Д„ ) в числителе формулы является мерой до­ полнительного объяснения вариации переменной у за счет включе­ ния /«2 переменных.

Критическое значение /у/• находят по таблице /"-распределения при заданном уровне значимости а и/i и ^ степенях свободы. Ес­ ли F< /у/а> 'г^ включение дополнительно объясняющих перемен­ ных совместно не оказывает значимого влияния на переменную у. Если F > Fff^, то /W2 объясняющих переменных совместно оказы­ вают существенное влияние на вариацию переменной у, и, следо­ вательно, в этом случае все nii переменные нельзя исключать из модели.

При реализации первой ситуации {F < iv/a) факторы оконча­ тельно исключаются из модели.

Ж, Проверка адекватности модели.

Данный этап анализа включает следующие процедуры:

оценку значимости коэффициента детерминации. Данная оцен­ ка необходима для решения вопроса: оказывают ли выбранные факторы влияние на зависимую переменную? Оценку значимости Д следует проводить, так как может сложиться такая ситуация, ког­ да величина коэффициента детерминации будет целиком обуслов­ лена случайными колебаниями в выборке, на основе которой он вычислен. Это объясняется тем, что величина Д существенно зави­ сит от объема выборки.

Для оценки значимости коэффициента множественной детер­

минации используется следующая статистика:

 

^- тЦ-Д) '

 

(5.31)

которая имеет ^-распределение cfi=mHf2

= n — т—I

степеня­

ми свободы. Здесь Д = Л^, а /w — количество учитываемых объяс­ няющих переменных (факторов).

Значение статистики F, вычисленное по эмпирическим дан­ ным, сравнивается с табличным значением /Wa. Критическое зна­ чение определяется по приложению 2 по заданному а и степеням свободы/i и/2. Если F > Fj-r^t, то вычисленный коэффициент де­ терминации значимо отличается от О и, следовательно, включен­ ные в регрессию переменные достаточно объясняют зависимую пе­ ременную, что позволяет говорить о значимости самой регрессии (модели);

проверку качества подбора теоретического уравнения. Она про­ водится с использованием средней ошибки аппроксимации. Сред­ няя ошибка аппроксимации регрессии определяется по формуле:

156

£ = ~ . i U ^ - ^

.100%;

(5.32)

« /=1 I УIT

I

 

вычисление специальных показателей, которые применяются для характеристики воздействия отдельных факторов на результи­ рующий показатель. Это коэффициент эластичности, который по­ казывает, на сколько процентов в среднем изменяется функция с изменением аргумента на 1% при фиксированных значениях дру­ гих аргументов:

Э л = й л - ^ ;

(5.33)

доля влияния каждого фактора Xj в отдельности на вариацию у':

gi =

ft•^

(5.34)

где Ру - коэффициент бета фактора Xj,

Показатель gj является мерой вариации результативного при­ знака за счет изолированного влияния фактора Xj, Следует отме­ тить, что система факторов, входящая в модель регрессии, - это не простая их сумма, так как система предполагает внутренние связи, взаимодействие составляющих ее элементов. Действие системы не равно арифметической сумме воздействий составляющих ее эле­ ментов. Поэтому необходимо определить показатель системного эффекта факторов г\у

На основе анализа специальных показателей и значений пар­ ной корреляции X с у делают вывод, какие из главных факторов оказывают наибольшее влияние на у. После этого переходят к раз­ работке организационно-технических мероприятий, направленных на улучшение значений этих факторов, с целью повышения (сни­ жения) результативного показателя у.

3. Экономическая интерпретация.

Результаты регрессионного анализа сравниваются с гипотеза­ ми, сформулированными на первом этапе исследования, и оцени­ вается их правдоподобие с экономической точки зрения.

^Елисеева И. И., Юзбашев М, М, Общая теория статистики. - М.: Фи­ нансы и статистика, 1999.

157

и. Прогнозирование неизвестных значений зависимой переменн

Полученное уравнение регрессии находит практическое приме­ нение в прогностическом анализе. Прогноз получают путем под­ становки в регрессию с численно оцененными параметрами значе­ ний факторов. Следует подчеркнуть, что прогнозирование резуль­ татов по регрессии лучше поддается содержательной интерпрета­ ции, чем простая экстраполяция тенденций, так как полнее учитывается природа исследуемого явления. Более подробно во­ просы прогнозирования рассмотрены в следующей главе.

Глава 6

Методы и модели прогнозирования временных рядов экономических показателей

6.1. Основные положения и понятия в прогнозировании временных рядов

Среди большого разнообразия экономико-математических ме­ тодов, используемых для решения задач управления предприятием, особое место занимают методы и модели прогнозирования.

Следует различать два понятия, связанных с прогнозировани­ ем, - предсказание и собственно прогнозирование.

Под предсказанием понимают суждение о будущем состоянии процесса, основанное на субъективном «взвешивании» большого числа факторов качественного и количественного характера. Про­ гнозирование — это исследовательский процесс, в результате кото­ рого получают прогноз о состоянии объекта. Прогноз является ве­ роятностным суждением о возможном состоянии объекта или об альтернативных путях его достижения. Известно большое количе­ ство методов, методик и способов прогнозирования. Все они осно­ ваны на двух крайних подходах: эвристическом и математическом.

Эвристические методы базируются на использовании явлений или процессов, не поддающихся формализации.

Для математических методов прогнозирования характерен под­ бор и обоснование математической модели исследуемого процесса, а также способов определения ее неизвестных параметров. Задача прогнозирования при этом сводится к решению уравнений, опи­ сывающих данную модель для заданного момента времени.

158

Среди математических методов прогнозирования в особую группу выделяются методы экстраполяции, которые отличаются простотой, наглядностью и легко реализуются на ЭВМ. Методоло­ гическая предпосылка экстраполяции состоит в признании пре­ имущественной связи между прошлым, настоящим и будущим. При этом развитие экономических явлений наиболее полно нахо­ дит свое отражение во временных рядах, которые представляют со­ бой упорядоченные во времени наборы измерений каких-либо ха­ рактеристик исследуемого объекта, процесса. Поэтому независи­ мая переменная для временного ряда, это, как правило, календар­ ные равные отрезки времени (год, квартал, месяц и т. д.). Основной чертой, выделяющей временные ряды среди других видов статисти­ ческих данных, является существенность порядка, в котором про­ изводятся наблюдения.

В ходе решения задачи прогнозирования пользуются ограни­ ченным количеством информации об одномерном временном ряде конечной длины. При этом в экономике исследуются дискретные временные ряды, наблюдаемые в дискретные моменты времени.

Дискретный временной ряд можно рассматривать как последо­ вательность значений Ух, У2, ..., Уп в моменты времени t, или сокра­ щенно >'ХГ= 1, 2, ..., п).

Временной ряд может быть представлен в следующем виде:

 

У/ = ^/ + ег,

(6.1)

где Xf -

детерминированная неслучайная компонента процесса;

 

е^ —

стохастическая случайная компонента процесса.

 

Детерминированная компонента (тренд) х^ характеризует суще­ ствующую динамику процесса в целом, основную, длительную тен­ денцию изменения изучаемого показателя. Стохастическая компо­ нента tf отражает случайные колебания или шумы процесса. Зада­ ча прогнозирования, в частности, состоит в определении вида экс­ траполирующих функций Xf и е^ на основе исходных эмпирических данных.

Отрезок времени i от момента времени Г, для которого имеют­ ся последние статистические данные об изучаемом процессе, до момента, к которому относится прогноз, называется периодом уп­ реждения (периодом прогноза). В зависимости от длительности пе­ риода упреждения применительно к экономике различают три ви­ да прогноза:

краткосрочные - с периодом упреждения от нескольких дней до трех лет;

среднесрочные — от трех до 5 лет;

долгосрочные — от 5 лет и выше.

159