Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лекций.doc
Скачиваний:
367
Добавлен:
09.04.2015
Размер:
1.28 Mб
Скачать

4 Применение регрессионного анализа для решения экономических задач1

Регрессионный анализ имеет своей целью вывод, определение (идентификацию) уравнения регрессии, включая статистическую оценку его параметров.

В основе любой регресси­онной модели лежит уравнение (или система уравнений) рег­рессии, которое показывает, каким будет в среднем измене­ние зависимой переменной у, если независимые переменные х примут конкретные значения. Это обстоятельство позволя­ет применять модель регрессии не только для анализа, но и для прогнозирования.

Основная задача прогнозирования с помощью регресси­онных моделей — оценить значение эндогенной переменной у для некоторого набора экзогенных переменных х, называе­мых регрессорами. Направление причинной связи между ис­следуемым показателем и отобранными факторами опреде­ляется путем предварительного обоснования и включается в модель как гипотеза, статистическую состоятельность кото­рой проверяют в процессе создания модели.

Различают уравнения (модели) парной и множественной регрессии. Когда уравнение регрессии математически описы­вает поведение множества данных исследуемого показателя у во взаимосвязи с массивом данных одной независимой пере­менной х, то говорят о модели парной регрессии. Модели мно­жественной регрессии отражают вклад нескольких независи­мых переменных х в результат исследуемого показателя у.

Для отображения и оценки регрессионной взаимосвязи переменных могут использоваться различные функции: ли­нейная, экспоненциальная, логарифмическая, полиноми­альная и др. Excel предлагает пользователю 15 функций рабочего листа, созданных непосредственно для этой цели, а также специальный инструмент анализа Регрессия, заметно увеличивающий эффективность проведения достаточно тру­доемких регрессионных вычислений.

Прогнозирование с использованием парной регрессии. Если при проведении корреляционного анализа были по­лучены достаточно высокие значения коэффициента парной корреляции (0,7 < |r| < 1), то можно попытаться оценить па­раметры и проверить статистическую значимость линейного уравнения связи вида у = b + mх. Однако реальная взаимос­вязь величин у и х может быть в лучшей степени описана не­линейной функцией. Изучить специфику зависимости и про­следить характер связи в случае двух переменных проще все­го графически, построив на плоскости ту линию, которая на­иболее адекватно отразит поведение точек базового ряда, с помощью команд и функций Excel.

Построение и оценка модели множественной регрессии. Процесс создания многофакторной модели на практике может оказаться достаточно длительным и сложным. Очень редко первое оцененное уравнение зависимости экономи­ческих переменных является удовлетворительным во всех отношениях. Обычно исследователю приходится постепен­но подбирать состав объясняющих переменных и формулу связи, анализируя на каждом этапе качество оцененной за­висимости.

Формально решить задачу построения модели множес­твенной регрессии можно лишь в том случае, когда количес­тво наблюдений n превышает число независимых факторов k и, по крайней мере, выполняется неравенство n>k+1. Положительная разность (n-k-1) называется числом степе­ней свободы. Если это число мало, то статистическая надеж­ность оцениваемой формулы не будет высокой. Поэтому обычно при оценке множественной регрессии требуется, что­бы число наблюдений не менее, чем в 3 раза превосходило количество объясняющих переменных х.

Если установлено, что связь исследуемого показателя и отобранных факторов носит линейный характер (что под­тверждают результаты корреляционного анализа), то анали­тической формой ее выражения может стать уравнение мно­жественной линейной регрессии. Наиболее часто используе­мая линейная модель множественной регрессии имеет вид

у = b + m1x1 + m2х2 + ... + mk xk + ε,

где ε — остаточная компонента, которая используется для оценки качества построенной модели.

Если связь между исследуемым показателем и факторны­ми признаками носит нелинейный характер, то для построе­ния моделей регрессии могут использоваться экспоненци­альная, степенная или логарифмическая функции. Если форму зависимости обосновать трудно, поиск модели связи можно провести с помощью разных уравнений и затем срав­нить полученные результаты.

Как и в случае парной регрессии, задача построения мо­дели множественной линейной регрессии связана с определе­нием и оценкой параметров уравнения b, m1, m2, ..., m3. Кри­терии оценивания параметров модели могут быть различны.

Наиболее приемлемым способом отбора факторных при­знаков для построения модели является шаговая регрессия. Сущность метода шаговой регрессии заключается в последо­вательном включении факторов в уравнение: сначала в рас­чет принимается один фактор, с которым у исследуемого по­казателя наиболее тесная линейная связь, затем второй, тре­тий и т.д. И на каждом шаге рассчитываются уравнение свя­зи и набор статистических характеристик, которые позволя­ют судить о качестве полученного уравнения. Если введение каждого последующего фактора не ухудшает общего качест­ва модели, то данный фактор признается существенным и его включение в уравнение регрессии необходимо. Если же при введении в уравнение факторного признака статистичес­кие характеристики его качества ухудшаются, то данный признак не включают в модель связи.

Между тем на определенном шаге построения модели прямым шаговым методом могут возникать ситуации, когда введение каждого из последующих факторов в отдельности ухудшает некоторые статистические характеристики моде­ли, а их совокупное введение приводит к получению статис­тически значимых величин. Поэтому на практике использу­ют и другие алгоритмы шагового регрессионного анализа, например, с последовательным исключением факторов, став­ших незначимыми в ходе анализа качества оцененной зави­симости (обратный метод).

Расчет формулы связи переменных еще не означает, что создана модель регрессии. До тех пор, пока не дана оценка ее качества, полученное уравнение остается лишь гипотезой. Анализ качества модели регрессии включает две составляю­щие: статистическую и содержательную.

Проверка статис­тического качества полученного уравнения предполагает оценку: общего качества уравнения; статистической значи­мости каждого параметра уравнения; наличия автокорреля­ции остатков.

Самым ответственным этапом, завершающим регресси­онный анализ, является содержательная оценка качества уравнения, которая состоит в его переводе с языка математи­ки и статистики на язык экономиста, проверке наличия эко­номического смысла в размере и характере влияния на ис­следуемый показатель каждого из объясняющих факторов.

Для статистической оценки общего качества уравнения линейной регрессии обычно используют коэффициент детер­минации R2, который представляет собой квадрат коэффи­циента множественной корреляции (для случая парной рег­рессии это квадрат коэффициента корреляции переменных х и у). Он характеризует долю объясненной части разброса за­висимой переменной у. Как правило, с добавлением еще од­ной переменной R2 увеличивается, но если объясняющие пе­ременные x1 и x2 сильно коррелируют между собой, то они объясняют одну и ту же часть разброса переменной у, и в этом случае ухудшаются показатели оценки статистической значимости параметров уравнения.

Чтобы убедиться в статистической надежности модели (или статистической значимости коэффициента детермина­ции R2) проверяют гипотезу о равенстве нулю одновременно всех параметров уравнения регрессии, за исключением сво­бодного члена. Такую проверку осуществляют по F-критерию, расчетное значение которого сравнивают с табличным. При заданном уровне значи­мости модель считается надежной, если расчетное значение F-статистики c v1 = k и v2 = (n-k-1) степенями свободы больше табличного Fкрит.

В качестве меры точности аппроксимации моделью ис­ходных данных применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отно­шение суммы квадратов уровней остаточной компоненты к величине (n - k - 1), квадратный корень из которой называ­ется стандартной ошибкой оценки.

Считается, что чем выше значение коэффициентов мно­жественной корреляции, детерминации и критерия Фишера и чем ниже значение стандартной ошибки, тем точнее полу­ченное уравнение связи описывает зависимости, сложивши­еся между исследуемым показателем и отобранными факторными признаками, тем, следовательно, выше общее каче­ство модели.

Для оценки статистической значимости отдельных пара­метров уравнения регрессии (т.е. проверки нулевой гипоте­зы для каждого из них) используют t-критерий, сравнивая рассчитанное значение t-статистики с найденным по таблице распределения Стьюдента при заданном уровне значимости Fкрит. Нулевая гипотеза отвергается, если t-наблюдаемое больше tкрит. В противном случае фактор, соответ­ствующий исследуемому параметру mk, признается незначи­мым и исключается из модели (при этом ее качество не ухуд­шается). Как и в случае парной регрессии, здесь можно при­ближенно считать оценку параметра незначимой, если t-статистика по модулю меньше единицы, и весьма надежной, ес­ли модуль t-статистики больше трех.

При проверке адекватности уравнения множественной регрессии исследуемому процессу возможны следующие ва­рианты:

1) построенная модель на основе ее проверки по F-критерию в целом адекватна и все параметры уравнения регрессии значимы. Такая модель может быть использована для про­гнозирования исследуемого показателя;

2) модель по F-критерию адекватна, но часть параметров регрессии не значима. В этом случае модель может быть при­годна для принятия отдельных решений, но не подходит для расчета прогнозов;

3) модель по F-критерию адекватна, но все параметры уравнения не значимы. Такая модель полностью считается неадекватной. На ее основе нельзя принимать решения и сос­тавлять прогнозы.

Одним из основных предположений, которые принима­ются при оценке качества линейного уравнения регрессии, является случайность и статистическая независимость от­клонений фактических данных исследуемого показателя от регрессионной прямой. Чтобы убедиться в этом обычно про­веряют некоррелированность отклонений от линии регрес­сии, причем некоррелированность не любых, а соседних зна­чений отклонений. Для этого рассчитывают коэффициент автокорреляции первого порядка.

При достаточном числе наблюдений (не менее 12-15), при 1-3 объясняющих переменных коэффициент автокорреляции ос­татков должен быть не менее -0,5 и не более 0,5. Когда коэф­фициент автокорреляции составляет 0,1-0,2-0,3, хотя и нельзя с абсолютной уверенностью утверждать о взаимной независимости отклонений от линии регрессии, этим обычно удовлетворяются при проверке их независимости. В против­ном случае признается наличие автокорреляции остатков, и полученная формула модели регрессии считается неудовлет­ворительной.

Таким образом, даже беглый взгляд на проблему построе­ния модели множественной регрессии отражает достаточно сложную схему вычислений и процедуры проверки качества полученной модели связи. Если учесть при этом громозд­кость расчетов названных выше статистических характерис­тик и необходимость использования методики шагового ана­лиза, которая предполагает многократное повторение всех описанных оценок по мере введения (исключения) каждого факторного признака, то становится ясным: поиски адекват­ной реальному процессу модели могут занять у исследовате­ля достаточно много времени. Для практической деятельнос­ти в сфере экономики это нередко равнозначно упущенным возможностям. Именно поэтому до последнего времени мно­гофакторный регрессионный анализ не нашел должного применения в экономическом прогнозировании. Внедрение в практику экономических расчетов персональных ЭВМ, значительно ускоряющих техническую сторону процедуры регрессионного анализа, расширяет возможности его приме­нения в прогнозировании и оперативном управлении ком­мерческой деятельностью.