Бережная_Матметоды моделирования эк cистем
.pdf2)формирование перечня факторов и их логический анализ;
3)сбор исходных данных и их первичная обработка;
4)спецификация функции регрессии;
5)оценка функции регрессии;
6)отбор главных факторов;
7)проверка адекватности модели;
8)экономическая интерпретация;
9)прогнозирование неизвестных значений зависимой пере менной.
Рассмотрим подробнее содержание этапов.
A. Априорное исследование экономической проблемы. В соответс вии с целью работы на основе знаний макро-и микроэкономики конкретизируются явления, процессы, зависимость между которы ми подлежит оценке. При этом подразумевается прежде всего чет кое определение экономических явлений, установление объектов и периода исследования.
На этом этапе исследования должны быть сформулированы экономически осмысленные и приемлемые гипотезы о зависимос ти экономических явлений.
Б. Формирование перечня факторов и их логический анализ. Для определения наиболее разумного числа переменных в регрессион ной модели прежде всего ориентируются на соображения профес сионально-теоретического характера. Исходя из физического смыс ла явления, производят классификацию переменных на зависимую
иобъясняющую.
B. Сбор исходных данных и их первичная обработка. При построе нии модели исходная информация может быть собрана в трех видах:
• динамические (временные) ряды;
•пространственная информация — информация о работе не скольких объектов в одном разрезе времени;
•сменная — табличная форма. Информация о работе несколь ких объектов за разные периоды.
Объем выборки зависит от числа факторов, включаемых в мо дель с учетом свободного члена. Для получения статистически зна чимой модели требуется на один фактор объем выборки, равный 1 = 5 -^ 8 наблюдений. Например, если в модель включаются три фактора, то минимальный объем выборки
Пшп = 5 . (/W + Л) = 5 . (3 + 1) = 20,
где т — число факторов, включаемых в модель; п — число свободных членов в уравнении.
Если в квартальном разрезе собирать данные, то надо их соби рать за 5 лет [20/4].
150
г. Спецификация функции регрессии. На данном этапе исследова ния дается конкретная формулировка гипотезы о форме связи (ли нейная или нелинейная, простая или множественная и т. д.). Для этого используются различные критерии ддя проверки состоятель ности гипотетического вида зависимости. На этом этапе проверя ются предпосылки корреляционно-регрессионного анализа.
Д. Оценка функции регрессии. Здесь определяются числовые зна чения параметров регрессии и вычисление ряда показателей, ха рактеризующих точность регрессионного анализа.
Е. Отбор главных факторов. Выбор факторов - основа для по строения многофакторной корреляционно-регрессионной модели.
На этапе формирования перечня факторов и их логического анализа собираются все возможные факторы, обычно более 20-30 факторов. Но это неудобно для анализа, и модель, включающая 20—30 факторов, будет неустойчива. Неустойчивость модели нахо дит выражение в том, что в ней изменение некоторых факторов ве дет к увеличению у вместо снижения ;;.
Мало факторов — тоже плохо. Это может привести к ошибкам при принятии решений в ходе анализа модели. Поэтому необходи мо выбирать более рациональный перечень факторов. При этом проводят анализ факторов на мультиколлинеарность.
Анализ и способы снижения влияния мультиколлинеарности на значимость модели. Мультиколлинеарность — попарная корреляци онная зависимость между факторами.
Мультиколлинеарная зависимость присутствует, если коэффи циент парной корреляции г^у = > 0,70 -г- 0,80.
Отрицательное воздействие мультиколлинеарности состоит в следующем:
1)усложняется процедура выбора главных факторов;
2)искажается смысл коэффициента множественной корреля ции (он предполагает независимость факторов);
3)усложняются вычисления при построении самой модели;
4)снижается точность оценки параметров регрессии, искажает ся оценка дисперсии.
Следствием снижения точности является ненадежность коэф фициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объяс няющей переменной на зависимую переменную.
Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выбор ки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы крите рия значимости, поэтому применение самих критериев становится
151
также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.
Для измерения мультиколлинеарности можно использовать ко
эффициент множественной детерминации |
|
Д = R \ |
(5.23) |
где R ~ коэффициент множественной корреляции. |
|
При отсутствии мультиколлинеарности факторов |
|
т |
|
JX=lclyj, |
(5.24) |
у=1
где dyj — коэффициент парной детерминации, вычисляемый по формуле
dyj = r^yj, |
(5.25) |
где Kyj — коэффициент парной корреляции между у-м фактором и зависи мой переменной у.
При наличии мультиколлинеарности соотношение (5.24) не со блюдается. Поэтому в качестве меры мультиколлинеарности ис пользуется следующая разность:
M = JX'-idyj. |
(5.26) |
у=1 |
|
Чем меньше эта разность, тем меньше мультиколлинеарность. Для устранения мультиколлинеарности используется метод исклю чения переменных. Этот метод заключается в том, что высоко корре лированные объясняющие переменные (факторы) устраняются из рефессии и она заново оценивается. Отбор переменных, подлежа щих исключению, производится с помощью коэффициентов пар ной корреляции. Опыт показывает, что если | г^у | > 0,70, то одну из переменных можно исключить, но какую переменную исключить из анализа, решают исходя из управляемости факторов на уровне предприятия.
Обычно в модели оставляют тот фактор, на который можно разработать мероприятие, обеспечивающее улучшение значения этого фактора в планируемом году. Возможна ситуация, когда оба мультиколлинеарных фактора управляемы на уровне предприятия. Решить вопрос об исключении того или иного фактора можно толь ко в соответствии с процедурой отбора главных факторов.
152
Отбор факторов не самостоятельный процесс, он сопровожда ется построением модели. Принятие решения об исключении фак торов производится на основе анализа значений специальных ста тистических характеристик и с учетом управляемости факторов на уровне предприятия.
Процедура отбора главных факторов. Эта процедура обязательно включает следующие этапы:
1. Анализ факторов на мультиколлинеарностъ и ее исключение.
Здесь производится анализ значений коэффициентов парной кор реляции r^y между факторами Х/ и Xj.
2 Анализ тесноты взаимосвязи факторов (х) с зависимой пере менной (у).
Для анализа тесноты взаимосвязи л: и у используются значения коэффициента парной корреляции между фактором и функцией {г^^). Величина г^^ определяется на ЭВМ и представлена в корре ляционной матрице вида (табл. 5.1).
Таблица 5.1
Корреляционная матрица
№'
|
переменной |
Х\ |
Х2 |
хз |
^т |
У |
|
|
|
|
|||
|
^ 1 |
1 |
^XiXi |
Гг|Хз |
^XiX„ |
^ХхУ |
1 |
^2 |
^х^\ |
1 |
'jfa^i |
^Х^т |
^xiy |
|
Хз |
*'хух^ |
^хухг |
1 |
^XiX„ |
^ХзУ |
|
^т |
''xmXi |
^Х^2 |
^х^з |
i |
^х„у |
|
У |
Гух, |
^УХг |
Гухз |
f-yx^ |
1 |
|
|
Факторы, для которых г^^ = О, т. е. не связанные с у, подлежат исключению в первую очередь. Факторы, имеющие наименьшее значение г^^, могут быть потенциально исключены из модели. Во прос об их окончательном исключении решается в ходе анализа других статистических характеристик.
3. Анализ коэффициентов Р факторов, которые потенциально мо гут быть исключены.
Коэффициент (3 учитывает влияние анализируемых факторов на j^ с учетом различий в уровне их колеблемости. Коэффициент Р показывает, насколько сигм (средних квадратических отклоне ний) изменяется функция с изменением соответствующего аргу мента на одну сигму при фиксированном значении остальных ар гументов:
153
^k=ci,^, |
(5.27) |
Су
где (3^ — коэффициент р к-го фактора;
Gx^ - среднее квадратическое отклонение А;-го фактора; Gy — среднее квадратическое отклонение функции; Of^ — коэффициент регрессии при к-м факторе.
Из двух факторов Х/ и Xj может быть исключен тот фактор, ко торый имеет меньшее значение р.
Допустим, исключению подлежит один из мультиколлинеарных факторов X/ или Xj. Оба фактора управляемы на уровне предприя тия, коэффициенты регрессии а^ и aj статистически значимы. Фак тор Х( более тесно связан с у, т. е. г^у > г^х,, но при этом Р^.. < Рд.. В этом случае обычно исключению подлежит фактор Xj. ' ^
4. Проверка коэффициентов регрессии на статистическую значи мость.
Проверка может быть произведена двумя способами:
• проверка статистической значимости а^- по критерию Стьюдента проводится по следующей формуле
h^-^^ |
(5.28) |
где Qj^ — коэффициент регрессии при к-м факторе; Sa — стандартное отклонение оценки параметра ai^\
Число степеней свободы статистики /^ равно / = « - W/ - 1,
где т - количество факторов, включенных в модель.
Значение /, вычисляемое по (5.28), сравнивают с критическим значением /^^, найденным по приложению 1 при заданном уровне значимости а и числе степеней свободы/(двухсторонняя критиче ская область).
Если tf^ > /уос, то Of^ существенно больше О, а фактор Xf^ оказыва ет существенное влияние на у. При этом фактор Xf^ оставляем в мо дели. Если t/^ < tf^^, то фактор исключаем из модели;
• проверка статистической значимости aj^ по критерию Фишера —
^к |
\ 2 |
=лt\ |
(5.29) |
'аи |
|
|
где Р" — многомерный аналог критерия Стьюдента.
' Ферстер Э., Ренц Б, Методы корреляционного и регрессионного ана лиза. — М.: Финансы и статистика, 1983.
154
Число степеней свободы статистики Fj^ следующее:/! "^ Ь /2 = « - W/ - 1. Значение Fj^, вычисляемое по формуле (5.29), срав нивают с критическим значением ^/а> найденным по приложе нию 2, при заданных уровне значимости а и числе степеней свобо ды/i, Л-
Если Fj^ > Ffff^, то ai^ - существенно больше О, а фактор х^ ока зывает существенное влияние на у. При этом фактор Xj^ оставляем в модели. Если Fj^ < Fj-f^, то фактор исключаем из модели.
5, Анализ факторов на управляемость,
В ходе логического анализа на основе экономических знаний исследователь должен сделать вывод: можно ли разработать орга низационно-технические мероприятия, направленные на улучше ние (изменение) выбранных факторов на уровне предприятия. Ес ли это возможно, то данные факторы управляемы. Неуправляемые факторы на уровне предприятия могут быть исключены из модели. Например, из двух факторов Xi - средняя техническая скорость ав томобилей и ^2 - время погрузки-разгрузки на одну ездку при ра венстве или близких по значению таких характеристик, как г^у и г^у, Р^ и Р^ , исключению подлежит Xj. На уровне АТП практиче ски невозможно повлиять на значение технической скорости, ко торая зависит в основном от климатических условий и величины транспортного потока.
6, Строится новая регрессионная модель без исключенных факто ров. Для этой модели определяется коэффициент множественной детерминации Д,
7, Исследование целесообразности исключения факторов из моде ли с помощью коэффициента детерминации.
Прежде чем вынести решение об исключении переменных из анализа в силу их незначимого влияния на зависимую перемен ную, производят исследования с помощью коэффициента детер минации.
В первой регрессий содержится т объясняющих переменных, во второй - только часть из них, а именно т^ объясняющих перемен ных. При этом т = mi -^ mi, т. е. во вторую регрессию мы не вклю чили /«2 объясняющих переменных. Теперь следует проверить, вно сят ли совместно эти /«2 переменных существенную долю в объясне ние вариации переменной у. Для этого используется статистика
{JX^-JX^^y{n-m-\) |
|
|
{т-тМ^-JX^) |
' |
<5.30) |
которая имеет /'-распределение cfi= т - |
mi= mjnfj- |
п - т - I |
степенями свободы. Здесь Д„ означает коэффициент детерминации
155
рефессии с т объясняющими переменными, а Д„ — коэффициент детерминации регрессии с mi-факторами.
Разность (Д„ - Д„ ) в числителе формулы является мерой до полнительного объяснения вариации переменной у за счет включе ния /«2 переменных.
Критическое значение /у/• находят по таблице /"-распределения при заданном уровне значимости а и/i и ^ степенях свободы. Ес ли F< /у/а> 'г^ включение дополнительно объясняющих перемен ных совместно не оказывает значимого влияния на переменную у. Если F > Fff^, то /W2 объясняющих переменных совместно оказы вают существенное влияние на вариацию переменной у, и, следо вательно, в этом случае все nii переменные нельзя исключать из модели.
При реализации первой ситуации {F < iv/a) факторы оконча тельно исключаются из модели.
Ж, Проверка адекватности модели.
Данный этап анализа включает следующие процедуры:
• оценку значимости коэффициента детерминации. Данная оцен ка необходима для решения вопроса: оказывают ли выбранные факторы влияние на зависимую переменную? Оценку значимости Д следует проводить, так как может сложиться такая ситуация, ког да величина коэффициента детерминации будет целиком обуслов лена случайными колебаниями в выборке, на основе которой он вычислен. Это объясняется тем, что величина Д существенно зави сит от объема выборки.
Для оценки значимости коэффициента множественной детер
минации используется следующая статистика: |
|
|
^- тЦ-Д) ' |
|
(5.31) |
которая имеет ^-распределение cfi=mHf2 |
= n — т—I |
степеня |
ми свободы. Здесь Д = Л^, а /w — количество учитываемых объяс няющих переменных (факторов).
Значение статистики F, вычисленное по эмпирическим дан ным, сравнивается с табличным значением /Wa. Критическое зна чение определяется по приложению 2 по заданному а и степеням свободы/i и/2. Если F > Fj-r^t, то вычисленный коэффициент де терминации значимо отличается от О и, следовательно, включен ные в регрессию переменные достаточно объясняют зависимую пе ременную, что позволяет говорить о значимости самой регрессии (модели);
• проверку качества подбора теоретического уравнения. Она про водится с использованием средней ошибки аппроксимации. Сред няя ошибка аппроксимации регрессии определяется по формуле:
156
£ = ~ . i U ^ - ^ |
.100%; |
(5.32) |
« /=1 I УIT |
I |
|
• вычисление специальных показателей, которые применяются для характеристики воздействия отдельных факторов на результи рующий показатель. Это коэффициент эластичности, который по казывает, на сколько процентов в среднем изменяется функция с изменением аргумента на 1% при фиксированных значениях дру гих аргументов:
Э л = й л - ^ ; |
(5.33) |
доля влияния каждого фактора Xj в отдельности на вариацию у':
gi = |
ft•^ |
(5.34) |
где Ру - коэффициент бета фактора Xj,
Показатель gj является мерой вариации результативного при знака за счет изолированного влияния фактора Xj, Следует отме тить, что система факторов, входящая в модель регрессии, - это не простая их сумма, так как система предполагает внутренние связи, взаимодействие составляющих ее элементов. Действие системы не равно арифметической сумме воздействий составляющих ее эле ментов. Поэтому необходимо определить показатель системного эффекта факторов г\у
На основе анализа специальных показателей и значений пар ной корреляции X с у делают вывод, какие из главных факторов оказывают наибольшее влияние на у. После этого переходят к раз работке организационно-технических мероприятий, направленных на улучшение значений этих факторов, с целью повышения (сни жения) результативного показателя у.
3. Экономическая интерпретация.
Результаты регрессионного анализа сравниваются с гипотеза ми, сформулированными на первом этапе исследования, и оцени вается их правдоподобие с экономической точки зрения.
^Елисеева И. И., Юзбашев М, М, Общая теория статистики. - М.: Фи нансы и статистика, 1999.
157
и. Прогнозирование неизвестных значений зависимой переменн
Полученное уравнение регрессии находит практическое приме нение в прогностическом анализе. Прогноз получают путем под становки в регрессию с численно оцененными параметрами значе ний факторов. Следует подчеркнуть, что прогнозирование резуль татов по регрессии лучше поддается содержательной интерпрета ции, чем простая экстраполяция тенденций, так как полнее учитывается природа исследуемого явления. Более подробно во просы прогнозирования рассмотрены в следующей главе.
Глава 6
Методы и модели прогнозирования временных рядов экономических показателей
6.1. Основные положения и понятия в прогнозировании временных рядов
Среди большого разнообразия экономико-математических ме тодов, используемых для решения задач управления предприятием, особое место занимают методы и модели прогнозирования.
Следует различать два понятия, связанных с прогнозировани ем, - предсказание и собственно прогнозирование.
Под предсказанием понимают суждение о будущем состоянии процесса, основанное на субъективном «взвешивании» большого числа факторов качественного и количественного характера. Про гнозирование — это исследовательский процесс, в результате кото рого получают прогноз о состоянии объекта. Прогноз является ве роятностным суждением о возможном состоянии объекта или об альтернативных путях его достижения. Известно большое количе ство методов, методик и способов прогнозирования. Все они осно ваны на двух крайних подходах: эвристическом и математическом.
Эвристические методы базируются на использовании явлений или процессов, не поддающихся формализации.
Для математических методов прогнозирования характерен под бор и обоснование математической модели исследуемого процесса, а также способов определения ее неизвестных параметров. Задача прогнозирования при этом сводится к решению уравнений, опи сывающих данную модель для заданного момента времени.
158
Среди математических методов прогнозирования в особую группу выделяются методы экстраполяции, которые отличаются простотой, наглядностью и легко реализуются на ЭВМ. Методоло гическая предпосылка экстраполяции состоит в признании пре имущественной связи между прошлым, настоящим и будущим. При этом развитие экономических явлений наиболее полно нахо дит свое отражение во временных рядах, которые представляют со бой упорядоченные во времени наборы измерений каких-либо ха рактеристик исследуемого объекта, процесса. Поэтому независи мая переменная для временного ряда, это, как правило, календар ные равные отрезки времени (год, квартал, месяц и т. д.). Основной чертой, выделяющей временные ряды среди других видов статисти ческих данных, является существенность порядка, в котором про изводятся наблюдения.
В ходе решения задачи прогнозирования пользуются ограни ченным количеством информации об одномерном временном ряде конечной длины. При этом в экономике исследуются дискретные временные ряды, наблюдаемые в дискретные моменты времени.
Дискретный временной ряд можно рассматривать как последо вательность значений Ух, У2, ..., Уп в моменты времени t, или сокра щенно >'ХГ= 1, 2, ..., п).
Временной ряд может быть представлен в следующем виде:
|
У/ = ^/ + ег, |
(6.1) |
где Xf - |
детерминированная неслучайная компонента процесса; |
|
е^ — |
стохастическая случайная компонента процесса. |
|
Детерминированная компонента (тренд) х^ характеризует суще ствующую динамику процесса в целом, основную, длительную тен денцию изменения изучаемого показателя. Стохастическая компо нента tf отражает случайные колебания или шумы процесса. Зада ча прогнозирования, в частности, состоит в определении вида экс траполирующих функций Xf и е^ на основе исходных эмпирических данных.
Отрезок времени i от момента времени Г, для которого имеют ся последние статистические данные об изучаемом процессе, до момента, к которому относится прогноз, называется периодом уп реждения (периодом прогноза). В зависимости от длительности пе риода упреждения применительно к экономике различают три ви да прогноза:
•краткосрочные - с периодом упреждения от нескольких дней до трех лет;
•среднесрочные — от трех до 5 лет;
•долгосрочные — от 5 лет и выше.
159