Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика.pdf
Скачиваний:
111
Добавлен:
28.02.2016
Размер:
1.4 Mб
Скачать

2. КОНСПЕКТ ЛЕКЦИЙ

РАЗДЕЛ I. ЭКОНОМЕТРИКА КАК НАУКА Тема 1. Проблемы эконометрического моделирования

1.1. Понятие эконометрики и ее место в экономических исследованиях

Эконометрика – математическое моделирование реальных экономических объектов (бюджета семьи, отдельного предприятия, отрасли промышленности, региона, экономики страны, мировой экономики). Эконометрика изучает количественные закономерности и взаимозависимости между анализируемыми экономическими показателями при помощи методов математической статистики.

Воснове этих методов лежит корреляционно-регрессионный анализ. Впервые современные методы математической статистики стали использоваться в биологии. В конце XIX века английский биолог К. Пирсон положил начало современной математической статистике изучением кривых распределения числовых характеристик организма. Затем он и его школа перешли к изучению корреляций в биологии и построению линейных функций регрессии.

Первые работы по эконометрике появились в конце XIX-начале XX века. В 1897 г. была опубликована работа одного из основателей математической школы

вэкономической теории В. Парето, посвященная статистическому изучению доходов населения в разных странах. Была предложена кривая Парето: y = A(x-a)α, где x – величина дохода, A и α – параметры зависимости, полученные статистическими методами.

Всамом начале XX века вышло несколько работ английского статистика Гукера, в которых он применил корреляционно-регрессионные методы, разработанные Пирсоном и его школой для изучения взаимосвязей экономических показателей, в частности, влияния числа банкротств на товарной бирже на цену зерна. В работах Гукера содержалась идея временного лага между экономическими переменными, а также идея корреляционного анализа не самих величин, а их приращений. В дальнейшем появилось большое число работ как по развитию теории математической статистики и ее прикладных элементов, так и по практическому приложению этих методов в экономическом анализе. К первой группе могут быть, например, отнесены работы Р. Фишера по дисперсионному анализу, ко второй – работы по оценке и исследованию производных функций, в частности, классическая работа Кобба и Дугласа 1982 г.

Экономические модели и эконометрические методы сейчас – это не только мощный инструмент для получения новых знаний в экономике, но и широко применяемый аппарат для принятия практических решений в прогнозировании, банковском деле, бизнесе.

Эконометрические модели позволяют определять особенности поведения экономического объекта и на основе этого предсказывать его функционирование при изменении каких-либо параметров. Т.е. эконометрическое исследование предполагает получение конкретного, количественного результата для исследуемого экономического объекта. Такое исследование должно базироваться на

7

объединении теории (различных экономических моделей) и практики (данных статистических исследований). Как свидетельствует экономическая теория, в экономике действуют устойчивые количественные закономерности, поэтому возможно их строго формализованное математическое описание (описание знаковыми математическими средствами), построение математических моделей.

Использование математического моделирования в экономике позволяет:

1)формально описать наиболее важные связи экономических переменных и объектов;

2)использовать методы дедукции для адекватных выводов из четко сформулированных исходных данных;

3)использовать методы математики и статистики для получения новых знаний об объекте;

4)излагать точно и компактно на языке математики положения экономической теории.

Математические модели использовались с иллюстративными и исследовательскими целями еще Ф. Кенэ, А. Смитом, Д. Рикардо. В XIX веке большой вклад в моделирование рыночной экономики внесла математическая школа (Л. Вальрас, О. Курно, В. Парето, Ф. Эджворт и т.д.). В XX веке математические методы моделирования применялись очень широко, с их использованием связаны многие работы, удостоенные Нобелевской премии по экономике (Д. Хикс, Р. Солоу, В. Леонтьев, П. Самуэльсон и др.).

В России в начале XX века большой вклад в математическое моделирование внесли В. Дмитриев и Е. Слуцкий. В 60-80-е годы после почти тридцатилетнего перерыва экономико-математическое направление возродилось (В. Немчинов, В. Новожилов, Л. Канторович, ЦЭМИ РАН), но это были попытки формально описать «систему оптимального функционирования социалистической экономики». Строились многоуровневые системы моделей народнохозяйственного планирования, оптимизационные модели отраслей и предприятий. Сейчас важной задачей является моделирование процессов рыночной экономики. Теоретические модели используются для описания и объяснения наблюдаемых процессов, эмпирическое построение и обоснование модели происходит на базе статистических данных.

Разрабатывая модели, экономисты выявляют существенные факторы, определяющие изучаемое явление, и отбрасывают детали, не существенные для решения поставленной проблемы. Формализация основных особенностей функционирования экономических объектов позволяет оценить возможные последствия воздействий на них и использовать эти оценки в управлении.

Построение экономико-математической модели происходит в несколько этапов:

1)формулировка предмета и цели исследования;

2)выявление структурных и функциональных элементов, их качественных характеристик;

3)словесное описание взаимосвязей между элементами модели;

4)формализация описательной модели;

8

5) расчеты по математической модели и анализ полученного решения. Экономические модели позволяют выявить особенности функционирования

экономического объекта и на основе этого предсказать будущее поведение объекта при изменении каких-либо параметров.

Примерами экономических моделей являются: модели потребительского выбора, модели фирмы, модели экономического роста, модели равновесия на финансовых, факторных и товарных рынках, модели макроэкономической динамики и другие. Однако любая экономическая модель абстрактна по определению и, следовательно, неполна, т.к. учитывает лишь существенные факторы, определяющие закономерности функционирования анализируемого объекта. Привязка экономической модели к конкретному экономическому объекту (например, к какому-либо предприятию, работающему в конкретных условиях) потребует от исследователя учитывать реакцию экономических показателей этого объекта на изменения каких-либо условий, а это возможно только при условии обработки реальных статистических данных, которые необходимы для эмпирического построения и обоснования моделей.

Примером эконометрической модели, имитирующей мировую экономику, может служить математическая модель «Мир-1», разработанная профессором прикладной математики и кибернетики Массачусетского университета США Д. Форрестором в 1970-х годах. Она состояла из 40 нелинейных уравнений, которые описывали взаимосвязь пяти параметров: численность населения, капиталовложения в экономику, объем использования невозобновляемых энергоресурсов, объем загрязнения окружающей среды и объем производства продовольствия. Это была попытка глобального моделирования, но результаты расчетов имели невысокую достоверность из-за сложности объекта и примитивности модели. В 1972 году Денис Медоуз сделал прогнозы состояния мировой экономики на 2047 год, используя более совершенную модель «Мир-3». По его расчетам к этому времени невозобновляемые сырьевые ресурсы будут исчерпаны, а нехватка продовольствия окажется катастрофической. Однако эти прогнозы можно оценивать лишь как качественные тенденции, имеющие место в мировой экономике.

1.2. Типы эконометрических моделей

Существует три основных типа моделей, результаты расчетов по которым можно использовать для имитации функционирования исследуемого объекта или прогнозирования его развития: регрессионные модели с одним уравнением, модели временных рядов и системы одновременных уравнений.

Регрессионная модель с одним уравнением основана на уравнении регрес-

сии, которое устанавливает функциональную взаимосвязь между зависимой пе-

ременной y и независимыми переменными x1, x2, …, xm:

 

y = f (x1, x2, …, xm, а0, а1, а2, …, аn),

(1.1)

где а0, а1, а2, …, аn – параметры уравнения.

В зависимости от вида функции f (x1, x2, …, xm, а1, а2, …, аn) уравнения регрессии делятся на линейные и нелинейные. Такие модели имеют широкую об-

9

ласть применения: исследование зависимости спроса на какой-либо товар от времени, урожайности – от количества внесенных удобрений, вида вспашки, и т.д. В теории регрессионного анализа решаются проблемы оценивания, верификации и отбора значимых параметров регрессионной модели.

К моделям временных рядов относятся модели: тренда, сезонности и модель тренда и сезонности. Их объединяет то, что они рассчитывают значения временного ряда, исходя из предыдущих его значений. Областью применения моделей временных рядов являются, например: изучение и прогнозирование объема продаж, объема производства, спроса и т.д.

При эконометрическом моделировании экономических объектов возможно построение таких систем уравнений, в которых одни и те же переменные в различных регрессионных уравнениях могут одновременно выступать и в качестве результирующих и в роли объясняющих переменных (например, модель спроса и предложения на какой-либо товар). Эти системы уравнений называют системами одновременных уравнений. Эконометрическая модель, содержащая систему одновременных уравнений, может быть представлена в структурной или приведенной форме.

Для описания основных видов элементов экономической модели целесообразно рассмотреть конкретную ситуацию и построить соответствующую ей модель.

Пусть существует фирма, выпускающая несколько видов продукции. В процессе производства используются три вида ресурсов: оборудование, рабочая сила и сырье. Эти ресурсы однородны, количество их известно и в данном производственном цикле увеличено быть не может. Задан расход каждого из ресурсов на производство единицы продукции каждого вида. Заданы цены продуктов. Нужно определить объем производства с целью максимизации стоимости произведенной продукции (или если предположить, что вся она найдет сбыт на рынке – общей выручки от реализации).

Для решения поставленной задачи нужно построить математическую модель, наполнить ее информацией, а затем провести по ней необходимые расчеты. Вначале при построении модели нужно определить индексы, экзогенные и эндогенные переменные и параметры. В нашей задаче свой индекс должен иметь каждый вид продукции (пусть это индекс i, меняющийся от 1 до n), а также вид ресурсов (если мы обозначим их одной переменной; пусть в нашей задаче ресурсы обозначены разными переменными). Далее опишем экзогенные переменные. Часто экзогенные переменные и параметры в моделях не разделяют. В рассматриваемой задаче заданы экзогенные переменные – это имеющиеся количества оборудования K, рабочей силы L и сырья R; заданные параметры – коэффициенты их расхода на единицу i-й продукции ki, li, и ri соответственно. Цены продуктов pi также известны.

Далее вводятся обозначения для эндогенных переменных – тех, которые определяются в ходе расчетов по модели и не задаются в ней извне. В нашем случае это неизвестные объемы производства продукции каждого i-го вида; обозначим их через x.

10

Закончив описание переменных и параметров, переходят к формализации условий задачи, к описанию ее допустимого множества и целевой функции (если таковая имеется). В нашей задаче допустимое множество – это совокупность всех вариантов производства, обеспеченных имеющимися ресурсами. Оно описывается с помощью системы неравенств:

k1x1 +k2 x2 +K+kn xn K,

ki xi K,

 

i

 

l1x1 +l2 x2 +K+ln xn L,

или li xi L,

(1.2)

r1x1 +r2 x2

+K+rn xn R,

i

ri xi R.

 

 

 

 

i

К этим ограничениям по ресурсам добавляются требования неотрицательности переменных x > 0; если бы какой-то ресурс нужно было израсходовать полностью (например, полностью занять всю рабочую силу), соответствующее неравенство превратилось бы в уравнение.

Если модель является оптимизационной (а данная модель такова), то наряду с ограничениями должна быть определена целевая функция, т.е. максимизируемая или минимизируемая величина, отражающая интересы принимающего решение субъекта. Для данной задачи максимизируется величина:

p1 x1 + p2 x2 +... + pn xn , или pi xi max (1.3)

i

Следует отметить, прежде всего, большой класс оптимизационных моделей. Такие задачи возникают при попытке оптимизировать планирование и управление сложными системами, в первую очередь, экономическими. Оптимизационную задачу можно сформулировать в общем виде: найти переменные х1, х2,…,хn, удовлетворяющие системе неравенств (уравнений)

ϕi (x1 , x2 ,..., xn ) bi i =1,2,..., m

(1.4)

и обращающие в максимум (или минимум) целевую функцию, т.е.

Z = f (x1,x2 ,...,xn ,α1,α2 ,...)max(min

(1.5)

(Условия неотрицательности переменных, если они есть, входят в ограни-

чения (1.4)).

Как известно, упорядоченная совокупность значений n переменных x1, x2, …, xn представляется точкой n-мерного пространства. В дальнейшем эту точку будем

обозначать Х = (x1, x2, …, xn) , а само оптимальное решение Х = (x1, x2, …, xn). Рассмотрим еще одну задачу – классическую задачу потребления, имею-

щую важное значение в экономическом анализе.

Пусть имеется n видов товаров и услуг, количество их (в натуральных единицах) x1, x2, …, xn, цены, соответственно, p1, p2, …, pn за единицу. Суммарная стоимость этих товаров и услуг составляет:

n

 

pi xi

(1.6)

i=1

Уровень потребления определяется функцией Z = f (x1, x2,…, xn), называемой функцией полезности. Необходимо найти такой набор товаров и услуг x1, x2, …, xn при данной величине доходов I, чтобы обеспечить максимальный уровень полезности, т.е.

Z = f (x1, x2 ,K, xn ) max

(1.7)

11

при условии

xi 0

 

n

 

p i xi I ,

(i =1,2,..., n)

(1.8)

i=1

Решения этой задачи, зависящие от цен p1, p2, …, pn и величины дохода I, называются функциями спроса:

Х = Х (pi, I)

(1.9)

Задачи оптимального программирования в наиболее общем виде классифицируются по следующим признакам:

1. По характеру взаимосвязей между переменными: а) линейные; б) нелинейные.

Вслучае (а) все функциональные связи в системе ограничений и функция цели – линейные функции; наличие нелинейности хотя бы в одном из упомянутых элементов приводит к случаю (б).

2. По характеру изменения переменных: а) непрерывные; б) дискретные.

Вслучае (а) значения каждой из управляющих переменных могут заполнять полностью некоторую область действительных чисел; в случае (б) все или хотя бы одна переменная могут принимать только целочисленные значения.

3. По учету фактора времени: а) статические; б) динамические.

Взадачах (а) моделирование и принятие решений осуществляются в условиях независимости от времени элементов модели в течение периода времени, на который принимается планово-управленческое решение. В случае (б) необходимо учитывать фактор времени.

4. По наличию информации о переменных:

а) задачи в условиях полной определенности (детерминированные); б) задачи в условиях неполной информации; в) задачи в условиях неопределенности.

Взадачах (б) отдельные элементы являются вероятностными величинами, однако известны или дополнительными статистическими исследованиями могут быть установлены законы их распределения. В случае (в) можно сделать предположение о возможных исходах случайных элементов, но нет возможности сделать вывод о вероятностях исходов.

5. По числу критериев оценки альтернатив: а) простые, однокритериальные задачи; б) сложные, многокритериальные задачи.

Взадачах (а) экономически приемлемо использование одного критерия оптимальности или удается специальными процедурами (например, «взвешиванием приоритетов») свести многокритериальный поиск к однокритериальному.

12

Сочетание признаков 1-5 позволяет группировать (классифицировать) в самом общем виде задачи и методы оптимального программирования.

Если критерий эффективности Z = f (x1 , x 2 ,..., α1 , α2 ,...) представляет линейную функцию, а функции ϕi (x1 , x 2 ,K, x n ) в системе ограничений (1.4) также

линейны, то такая задача является задачей линейного программирования. Если, исходя из содержательного смысла, ее решения должны быть целыми числами, то эта задача целочисленного линейного программирования. Если критерий эффективности и (или) система ограничений задаются не линейными функциями, то имеем задачу нелинейного программирования. В частности, если указанные функции обладают свойствами выпуклости, то полученная задача является задачей выпуклого программирования.

Заметим, что задача нелинейного программирования после соответствующих преобразований может быть сведена к задаче линейного программирования.

1.3.Переменные эконометрических моделей

Вэконометрических моделях в зависимости от конечных прикладных целей их использования можно выделить три основных типа переменных: экзогенные (определяющие), эндогенные (результирующие) и предопределенные.

Экзогенные переменные – переменные, которые заранее известны и задаются пользователем модели в начале расчетов. Другими словами, это объясняющие

переменные регрессии (регрессоры) x1, x2, …, xm.

Эндогенные переменные – переменные, значения которых определяются в ходе расчетов по модели и не задаются в начале расчета. Это зависимые (по эко-

номическим соображениям) переменные регрессии y1, y2, …, yn. Предопределенные переменные – совокупность экзогенных переменных и

лаговых переменных (эндогенных переменных, взятых за предыдущие моменты наблюдений).

Эконометрическая модель устанавливает определенную взаимосвязь между эконометрическими переменными. Например, формирующийся на рынке спрос на некоторый товар рассматривается как функция его цены; затраты производства зависят от объема производства; потребительские расходы функция от доходов и т.д. Здесь спрос, производственные расходы и потребительские расходы играют роль результирующих переменных, а цена, объем производства и уровень доходов – объясняющие переменные.

Для определения влияния на значение результирующей переменной всех неучтенных факторов в данной эконометрической модели в уравнение регрессии добавляют в виде слагаемого остаточную случайную составляющую ε.

Модель парной регрессии будет иметь вид:

y = а0 + а1 x + ε

(1.10)

Остаточная случайная составляющая отражает

вероятностный характер

значений результирующих переменных эконометрической модели, т.е. обуславливает стохастический характер зависимостей.

13

РАЗДЕЛ II. МОДЕЛИ ПАРНОЙ РЕГРЕССИИ Тема 2. Основы регрессионного анализа

2.1.Основные этапы регрессионного анализа

Встатистике принято различать следующие варианты зависимостей:

1)парную корреляцию – связь между двумя признаками (результативным и факторным);

2)частную корреляцию – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков;

3)множественную корреляцию – зависимость результативного и двух или более факторных признаков, включенных в исследование.

В процессе этих статистических исследований вскрываются причинноследственные отношения между явлениями, которые записываются в виде тех или иных функциональных зависимостей.

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (Y) от факторных (х1, х2, ..., хп), выражаемая в виде уравнения регрессии:

Y=f (x1 , x2 ,..., xn)

(2.1)

Регрессионный анализ включает следующие этапы:

1)предварительный анализ свойств моделируемой совокупности единиц;

2)определение типа функции;

3)определение и проверку коэффициентов регрессии;

4)расчет значений функции для отдельных значений аргумента;

5)исследование рассеивания по отклонениям расчетных значений от эмпирических данных.

На стадии предварительного анализа свойств моделируемой совокупности единиц выявляют наличие или отсутствие корреляционной связи между признаками. Это делается с помощью анализа корреляционной и групповой таблицы, поля корреляции и эмпирической линии связи.

Для количественной оценки тесноты связи широко используется линейный коэффициент корреляции, который был впервые введен в начале 90-х годов прошлого столетия английским математиком К. Пирсоном.

Прежде чем вывести формулу коэффициентов корреляции необходимо дать определения дисперсии (D) и среднего квадратического отклонения (σ).

Дисперсия (D) – характеристика значений показателя, отражающая степень разброса отдельных значений показателя от среднего. Дисперсия рассчитывается по следующим формулам.

Для несгруппированных данных:

n

(yi y)2

D = i=1

n

Для сгруппированных данных (вариационного ряда):

n

( yi y)2 × fi

D = i=1 n

fi

i=1

(2.2)

(2.3)

14

Формулу для расчета дисперсии после некоторых преобразований можно привести к следующему виду:

n

yi2

D =

i=1

(y)2 = y2 (y)2

(2.4)

n

 

 

 

При пользовании этой формулой исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от x , а также ошибка в расчете, связанная с округлением отклонений ( yi y).

Среднее квадратическое отклонение σ представляет собой корень квадрат-

ный из дисперсии.

Для несгруппированных данных:

 

n

( yi y ) 2

(2.5)

σ =

i =1

n

,

для вариационного ряда:

 

 

 

 

 

 

 

σ =

n

( yi y ) 2 × fi

(2.6)

i =1

n

 

 

 

f i

 

 

 

i =1

 

 

Единица измерения среднего квадратического отклонения та же, что и индивидуального значения признака. В теории разработаны и на практике применяются различные модификации формул расчета коэффициента корреляции:

r =

(x x)(y y)

(2.7)

σxσY

 

 

 

Используя математические свойства средней, получаем следующую формулу для коэффициента парной корреляции показателя тесноты связи для линейных однофакторных зависимостей:

r = xy x y

(2.8)

σxσY

 

Преобразование данной формулы позволяет получить следующую формулу линейного коэффициента корреляции:

r =

(x x)( y y)

.

(2.9)

 

(x x)2 ×( y y)2

Вычисление коэффициента корреляции по формуле (2.9) является достаточно трудоемкой операцией. Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:

nxi yi xi yi

r =

 

i

 

i

 

i

 

(2.10)

 

 

 

nyi2 (yi )2

nxi2 (xi )2

 

 

i

i

 

 

i

i

 

 

15

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:

r = ai

σ x

,

(2.11)

 

 

σY

 

где αi – коэффициент регрессии в уравнении связи;

σx, σY средние квадратические отклонения соответствующих признаков (факторного и результативного).

Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Легко доказывается, что условие r = 0 является необходимым для того, чтобы величины х и у были независимы. Если же r = 1, то это означает, что все точки с координатами (х, Y) находятся на прямой и зависимость между Y и х является функциональной.

Линейный коэффициент корреляции изменяется в пределах от -1 до +1; т.е. 1 r 1. Знаки коэффициентов регрессии и корреляции совпадают.

Пример 1. Пусть имеются данные зависимости количества туристов от затрат на рекламу, представленные в таблице 2.2.1:

 

 

 

 

 

Таблица 2.2.1

 

Зависимость количества туристов от затрат на рекламу

 

 

 

 

Затраты

 

Поряд-

Затраты на

Количество туристов,

Порядко-

Количество тури-

ковые

рекламу xi,

воспользовавшихся

вые номера

на рекла-

стов, воспользо-

номера

усл. ден. ед.

услугами фирмы Yi,

фирм

му xi, усл.

вавшихся услугами

фирм

 

человек

 

ден. ед.

фирмы Yi, человек

1

8

800

11

10

920

2

8

850

12

10

1060

3

8

720

13

10

950

4

9

850

14

11

900

5

9

800

15

11

1200

6

9

880

16

11

1150

7

9

950

17

11

1000

8

9

820

18

12

1200

9

10

900

19

12

1100

10

10

1000

20

12

1000

Используя данные зависимости количества туристов от затрат на рекламу, рассчитаем по формуле (2.10) коэффициент корреляции:

20

 

20

20

 

 

20

 

 

xi =199;

Yi =19050;

xiYi =192310; ( xi )2 = 39601;

 

i=1

 

i=1

i=1

 

 

i=1

 

 

 

 

 

 

 

 

20

=

362902500;

20

 

= 2013;

20

=18497700.

 

( Y )2

x

2

Y 2

 

i

 

 

i

 

 

i

 

 

i=1

 

i=1

 

 

i=1

 

 

 

 

 

20 ×192310 199 ×19050

 

 

r = (20 × 2013 39601)(20 ×18497700 362902500)

= 0,8105.

16

Полученная величина линейного коэффициента корреляции свидетельствует о возможном наличии сильной прямой связи между рассматриваемыми признаками, т.к. его величина близка к 1,0.

Для проверки наличия корреляции при парной связи может быть использован также такой показатель, как коэффициент ковариации. Коэффициент ковариации – характеристика тесноты связи показателей У и х, значения которых Yi, xi (i = l,...,n) содержат случайные составляющие, вычисляется по формуле:

K xY

=

1

n

 

 

 

(Yi Y

)(xi x).

(2.12)

 

 

 

n i=1

 

Между коэффициентами корреляции и ковариации существует следующая взаимосвязь:

r =

KxY

(2.13)

σxσY

 

 

Следует отметить недостаток коэффициента ковариации, связанный с тем, что его значение зависит от единицы измерения.

Важным этапом регрессионного анализа является определение типа функции, которая характеризует зависимость между результирующими (Y) и объясняющими переменными (х1, х2, ... , хп) и правильно отражает сущность связи между явлениями. Определяющим основанием для выбора вида уравнения служит анализ экономической природы изучаемого объекта. Однако на основе теоретического анализа могут быть сделаны общие, т.е. неточные выводы относительно направления искомой зависимости. Поэтому эти предположения должны быть дополнены корреляционным анализом конкретных фактических данных. Чтобы можно было правильно определить тип функции, нужно на основе эмпирических данных определить:

1)направление связи;

2)изменяется ли направление связи для представленной совокупности эмпирических данных, т.е. является ли зависимость монотонной;

3)имеет связь линейный или нелинейный характер.

Необходимые для определения типа функции сведения получают из эмпирического материала. Представление о направлении и форме связи (аналитическом выражении) получают путем параллельного сравнения рядов из графика. Пары величин Y и х располагают по мере возрастания или убывания величины х.

По направлению связи различают:

а) прямую регрессию, возникающую при условии: с увеличением или уменьшением независимой величины х значение зависимой величины Y также соответственно увеличивается или уменьшается;

б) обратную регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины х зависимая величина Y соответственно уменьшается или увеличивается.

Для определения формы связи рекомендуется сравнить разность между следующими друг за другом величинами признаков. Если признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная. Если тенденция изменения Y в зависимости от изменения х отсутствует, то это свидетельствует о сильной вариации Y или невозможности установить наличие действительной связи.

17

Для характеристики связей экономических явлений применяют, прежде всего, следующие типы функций:

линейную: Y = a0 + a1 x ;

гиперболическую: Y = a0 + a1 1x ;

показательную: Y = a0 a1x ;

параболическую: Y =a0 + a1x + a2 x2 ;

степенную: Y = a 0 xa2 ;

логарифмическую: Y =a 0 + a1 lg x.

Линейная функция используется в том случае, когда результативный и факторный признаки возрастают одинаково (примерно в арифметической прогрессии), гиперболическая – когда связь между Y и х обратная. Параболическая или степенная функция применяются, если факторный признак увеличивается в арифметической прогрессии, а результативный – значительно быстрее.

Таким образом, задачи корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками и оценке факторов, наиболее влияющих на результативный признак.

Регрессионный анализ решает задачи выбора типа модели, установление степени влияния определяющей переменной на результирующую переменную и определение расчетных значений результирующей переменной, т.е. цель регрессионного анализа состоит в объяснении поведения зависимой переменной Y. Следующий этап корреляционного анализа – параметризация, т.е. определение коэффициентов выбранного уравнения регрессии. Для нахождения параметров а0 и а1 уравнения регрессии используют метод наименьших квадратов.

В зависимости от количества переменных различают модели парной регрессии и модели множественной регрессии. Приведенные выше рассуждения относятся к парной регрессии, характеризующей связь между двум признаками: результативным (Y) и факторным (х).

2.2. Метод наименьших квадратов

Пусть Y =a 0 + a1x уравнение связи результативного показателя и фактора в

виделинейногоуравнения, гдеY – результативныйпризнак; х– факторныйпризнак. Для нахождения параметров а0 и а уравнения регрессии обычно используют метод наименьших квадратов – метод определения зависимости результативного признака от факторного путем минимизации суммы квадратов отклонений фактических значений результирующего показателя от значений, определяемых

уравнением регрессии.

Сущность метода наименьших квадратов заключается в нахождении параметров модели а0 и а1, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

S = (Y Yx )2 min

(2.14)

Для линейной однофакторной модели:

 

S = (Y a0 a1 x)2 min

(2.15)

18

Функция двух переменных S (α0, α1) может достигнуть экстремума в том случае, когда первые частные производные этой функции равняются нулю, т.е. когда

dS

= 0 и

dS

= 0

(2.16)

 

 

da0

da1

 

Вычисляя эти частные производные, получим:

 

dS

= −2(Y a0 a1 x) = 0,

 

 

 

 

da0

(2.17)

dS

 

 

= −2(Y a0 a1 x) x = 0

da

1

 

 

После несложных преобразований получаем систему нормальных уравнений для определения величины параметров а0 и а1 уравнения линейной однофакторной модели:

na0

+ a1

x = Y ,

(2.18)

a0 x + a1 x2 = xY,

 

где п объем исследуемой совокупности (число единиц наблюдений).

В уравнении регрессии свободный член регрессии коэффициент α0 показывает совокупное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; его вклад в значение результирующего показателя не зависит от изменения факторов; параметр α1 – коэффициент регрессии – показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Пример 2. Допустим, что мы имеем 7 наблюдений величин x и y , т.е. семь пар чисел. Например, это результат наблюдений зависимости производственных затрат y (млн. руб.) от объема выпускаемой продукции x (тыс.шт.) для пяти различных предприятий, выпускающих один и тот же вид продукции.

x

1

4

7

11

15

17

22

 

 

 

 

 

 

 

 

y

3

6

10

14

18

24

30

 

 

 

 

 

 

 

 

Если коэффициент корреляции переменных x и y отличен от нуля, то эти величины статистически зависимы, однако он не дает представления о том, каким образом они связаны. Если абсолютное значение коэффициента корреляции близко к 1.0, то определить значения коэффициентов а0 и а1 в линейном уравнении регрессии можно следующим образом:

y = а0 + а1 x + ε.

Необходимо понять, что мы никогда не сможем рассчитать истинные значения а0 и а1 при попытке построить прямую и определить положение линии регрессии. Можно получить только оценки коэффициентов α0 и α1, а они могут быть «хорошими» или «плохими». Рассмотрим алгебраический способ, позволяющий достаточно точно оценить значения коэффициентов а0 и а1. Для этого необходимо определить остатки для каждого наблюдения i:

yi – (а0 + а1 xi),

где yi истинное значение переменной y в i-ом наблюдении;

19

а0 + а1 xi – значение переменной y в i-ом наблюдении, рассчитанное по искомому уравнению регрессии.

Метод наименьших квадратов (МНК) для рассматриваемой модели парной регрессии заключается в выборе таких коэффициентов а0 и а1, которые обеспечивают наименьшее значение суммы квадратов остатков:

5

[yi - (a0 +a1 x)]2

 

S =

(2.19)

i=1

Полученное выражение для S является квадратичной функцией от а0 и а1 и ее коэффициенты определяются выборочными значениями x и y . При этом значения x и y не могут быть изменены, т.к. они характеризуют реальную выборку по анализируемым торговым точкам (для нашего примера).

Принцип минимизации суммы квадратов остатков эквивалентен минимизации дисперсии остатков. Т.е. МНК дает максимально возможное для данной вы-

борки значение коэффициента детерминации R2 . Чем ближе коэффициент детерминацииR 2 к 1, тем ближе точки корреляционного поля (выборка (x, y)) к линии регрессии y =α0 +α1x .

По данным таблицы, полагая, что зависимость между х и Y линейная, определим значения коэффициентов а0 и а1: для определения величин а0 и а1 необходимо вычислить следующие значения: x, Y , xY, x2 .

Расчеты рекомендуется проводить по образцу табл. 2.2.2.

 

Расчет параметров уравнения регрессии

Таблица 2.2.2

 

 

 

 

 

 

 

 

 

 

№ п/п

x

Y

х2

xY

 

Yx

1

1

3

1

3

 

2,07

2

4

6

16

24

 

5,92

3

7

10

49

70

 

9,77

4

11

14

121

154

 

14,91

5

15

18

225

270

 

20,05

6

17

24

289

408

 

22,61

7

22

30

484

660

 

29,03

Итого

77

105

1185

1589

 

104,36

Система нормальных уравнений для данного примера имеет вид:

7a0 +77a1 =105;

77a0 +1185a1 =1589.

Умножим первое уравнение на -11 и прибавим его ко второму для того, чтобы исключить переменную а0. Получим:

(11 × 7a 0 + 77a 0 ) + (11 × 77a1 +1185 a 1 ) = −11 ×105 +1589 ; 338a1 =434;

a1 =1,284

20

Подставим полученное значение α1 в первое уравнение:

7a 0 + 77 ×1,284 =105;

7a 0 + 98,87 =105; a 0 = 0,876.

Следовательно, Yx = 0,876 +1,284x.

Коэффициент а1 показывает, что при увеличении x на единицу Yx увеличивается на 1,284. Коэффициент α0 = 0,876 показывает влияние неучтенных факторов. Связь между x и Y по направлению прямая, по форме – линейная.

Линейную однофакторную модель очень удобно представлять графически. Она изображается прямой Y = a0 +a1x.

Параметр α1 называют коэффициентом регрессии, выражающим величину изменения результативного признака при изменении фактора на единицу собственного измерения. При наличии прямой связи α1 имеет положительное значение, в случае обратной связи коэффициент регрессии отрицательный. Коэффициенты регрессии применяют для определения коэффициента эластичности, который показывает, на сколько процентов изменится величина результативного признака Y при изменении факторного признака х на один процент.

2.3. Свойства коэффициентов регрессии

Свойства коэффициентов регрессии существенно зависят от свойств остаточной случайной составляющей ε. Для того чтобы регрессионный анализ, использующий классический метод наименьших квадратов, давал наилучшие результаты, остаточная случайная составляющая для модели парной регрессии должна удовлетворять следующим условиям:

остаточная случайная составляющая в каждом наблюдении имеет нулевое математическое ожидание: М(εi) = 0 для любого i-го наблюдения;

дисперсия остаточной случайной составляющей не зависит от номера на-

блюдения: σ2(εi) =const. Это свойство называется гомоскедастичностью;

остаточные случайные составляющие уравнения регрессии в разных наблюдениях не зависят друг от друга: cov (εi,εj) = 0, при условии i j ;

остаточная случайная составляющая и объясняющая переменная для ка-

ждого наблюдения не зависят друг от друга: cov (εi,xi) = 0.

Фактически это условия Гаусса-Маркова для модели парной регрессии. Случайная остаточная составляющая определяется несколькими факторами,

которые не учитываются объясняющими переменными в уравнении регрессии. Известно, что если случайная величина является общим результатом взаимодействия большого числа других случайных величин, ни одна из которых не преобладает, то она имеет приблизительно нормальное распределение (центральная предельная теорема). Поэтому предполагается нормальность распределения остаточной случайной составляющей, что приводит к нормальному распределению коэффициентов регрессии. Коэффициент α0 есть мера наклона линии регрессии.

21