Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка для индивидуалок по эконометрике.doc
Скачиваний:
53
Добавлен:
14.02.2015
Размер:
2.05 Mб
Скачать

2.3. Типовой пример выполнения индивидуальной работы по теме 2.

Задание:

По исходным данным (табл. 2.1) необходимо:

1. Вычислить матрицу коэффициентов парной корреляции и проанализировать тесноту связи между показателями.

2. Выбрать вид линейной модели регрессии, включив в нее два фактора. 3. Обосновать исключение их модели трех других факторов.

3. Аналитическими методами

а) оценить параметры и качество модели,

б) вычислить среднюю ошибку аппроксимации,

в) вычислить множественный коэффициент детерминации.

4. С целью проверки полученных результатов провести регрессионный анализ выбранной модели с помощью Exel.

5. Проанализировать влияние факторов на зависимую переменную (вычислить соответствующие коэффициенты эластичности и -коэффициенты, пояснить смысл полученных результатов).

6. Выбрать с помощью Exel наилучший вид тренда временных рядов, соответствующих оставленным в моделях переменным. По полученным зависимостям вычислить их прогнозные значения на два шага вперед.

7. Определить точечные и интервальные прогнозные оценки объема реализации продукции фирмы Y на два шага вперед.

Таблица 2.1. – Исходная информация

Y

X1

X2

X3

X4

X5

222

1

5,2

9,1

13,9

67

223

2

4,5

11,4

14

71

230

3

6,7

8,9

13,8

73

232

4

6,8

17,4

14,6

65

232

5

7,8

16,1

13,9

79

240

6

3,9

14,6

14,7

81

240

7

5,1

12,9

14,8

90

212

8

3,9

10,4

14,9

92

250

9

3,8

10,5

14,7

126

251

10

3,8

5,8

14,6

102

254

11

5

19,9

14,4

94

254

12

5,5

10,3

14

96

259

13

6,7

19,6

13,9

91

264

14

8,9

5,9

14

101

264

15

9,1

9,6

13,2

103

266

16

10,3

18,2

13,5

104

220

17

12,7

5,5

13,2

88

268

18

13,8

18,2

11,9

101

269

19

14,9

8,6

11,9

105

270

20

15

5,3

13

108

Решение:

Исходные данные для анализа:

Объем реализации – зависимая переменная Y.

Объясняющие переменные:

X1 – время,

X2 – расходы на рекламу,

X3 – цена товара,

X4 – средняя цена конкурентов,

X5 – индекс потребительских расходов.

Статистические данные по всем переменным приведены в таблице 1.

Число наблюдений n=20, факторных признаков m=5.

1. Для вычисления матрицы коэффициентов парной корреляции воспользуемся возможностями Пакета программ Exel.

Для проведения корреляционного анализа используем инструмент Корреляция.

Для проведения корреляционного анализа нужно выполнить следующие действия:

    1. расположить данные в смежных диапазонах ячеек;

    2. выбрать команду Сервис/Анализ данных (рис.2.2.)

Рис. 2.2. Диалоговой окно Сервис

3) в диалоговом окне Анализ данных выбрать инструмент Корреляция (рис. 2.3), щелкнуть по кнопке ОК. появится диалоговое окно Корреляция (рис. 2.4).;

Рис. 2.3. Выбор инструмента анализа Корреляция

Рис. 2.4. Диалоговое окно Корреляция

4) в диалоговом окне Корреляция в поле «Входной интервал» необходимо ввести диапазон ячеек, содержащих исходные данные. Если также выделены заголовки столбцов, то установить флажок «Метка в первой строке». Выбрать параметры вывода. Щелкнуть по кнопке ОК.

На новом рабочем листе получаем результаты вычислений – таблицу значений коэффициентов парной корреляции (рис. 2.5).

Рис. 2.5. Результаты корреляционного анализа

Выбор вида модели

Анализ матрицы коэффициентов парной корреляции показывает, что

а) зависимая переменная, т.е. объем реализации, имеет тесную связь со следующими факторами:

X1 – время ryx1 = 0,742,

X5 – индекс потребительских расходов ryx5 = 0,694,

X2 – расходы на рекламу ryx2 = 0,507,

X4 – средняя цена конкурентов ryx4 = -0,506.

Причем, связь между объемом реализации и факторами X1, X5, X2 прямая, а связь между объемом реализации и фактором X4 (средняя цена конкурентов) судя по знаку, стоящему перед соответствующим коэффициентом парной корреляции, обратная.

Вместе с тем, полученный результат нельзя интерпретировать как снижение объема реализации за счет роста средней цены конкурентов (это противоречит основным экономическим законам, по которым развивается рынок). Отрицательное значение коэффициента парной корреляции в данном случае обусловлено очень тесной связью между фактором X4 и фактором X2 (rx2x4 == – 0,895), а также достаточно тесной связью данного фактора с фактором X1 (rx4x2 = – 0,669).

б) Связь результата с фактором X3 (цена товара) – очень низкая прямая.

в) связь между факторами:

X1 и X2 – прямая, сильная,

X1 и X3 –обратная, слабая,

X1 и X4 –обратная, достаточно тесная,

X1 и X5 –прямая, сильная,

X2 и X3 – обратная, слабая,

X2 и X4 – обратная, сильная,

X2 и X5 – прямая, слабая

X3 и X4 – прямая, слабая,

X3 и X5 – обратная, слабая,

X4 и X5 – обратная, слабая.

2.) Изучив взаимосвязь между факторами, можем сделать вывод, что между следующими парами факторов существует достаточно тесная связь:

X1 и X2 rx1x2 =0,780

X1 и X5 rx1x2 =0,722

X2 и X4 rx2x4 == – 0,895

Поскольку все три коэффициента парной корреляции по модулю превышают значение 0,7, то делаем следующие выводы:

факторы X1 и X2 коллинеарны,

факторы X1 и X5 коллинеарны

факторы X2 и X4 коллинеарны.

Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, а коллинеарность факторов нарушает это условия, исключим из модели следующие факторы:

1 шаг:

исключаем фактор X1 – время.

Несмотря на то, что фактор X1 имеет более тесную связь с результативным признаком, в модели оставим факторы X2 и X5 , поскольку у этих факторов наряду с достаточно тесной связью с результатом наименьшая связь с другими факторами в модели.

2 шаг:

В модели остались факторы X2, X3, X4, X5., причем факторы X2 и X4 коллинеарны. Оба коллинеарных фактора имеют примерно одинаковую связь как с результатом, так и с другими факторами модели.

Из двух этих факторов оставим в модели X2 – расходы на рекламу. Определяющим моментом в нашем выборе послужил тот факт, что отрицательное значение коэффициента парной корреляции между фактором X4 и результатом Y противоречит существующим представления о природе взаимосвязи данных показателей

3 шаг:

Из модели также исключим фактор X3, т.к. связь данного фактора с результативным признаком невысокая (rух3=0,105).

После исключения незначимых факторов имеем n=20, k=2.

Модель приобретает вид:

,

Оценка параметров модели

3. С помощью аналитического метода

3а) Проведем оценку параметров модели:

На основе метода наименьших квадратов (МНК) проведем оценку параметров регрессии по формуле:

При этом используем данные, приведенные в таблице 2.2

Таблица 2.2. – Исходная информация

Y

Хо

X2

X5

Объем реал.

Реклама

Инд. п. расх.

222

1

5,2

67

223

1

4,5

71

230

1

6,7

73

232

1

6,8

65

232

1

7,8

79

240

1

3,9

81

240

1

5,1

90

212

1

3,9

92

250

1

3,8

126

251

1

3,8

102

254

1

5

94

254

1

5,5

96

259

1

6,7

91

264

1

8,9

101

264

1

9,1

103

266

1

10,3

104

220

1

12,7

88

268

1

13,8

101

269

1

14,9

105

270

1

13

108

Для вычисления вектора оценок параметров регрессии воспользуемся следующими встроенными в Exel функциями:

МУМНОЖ – умножение матриц,

ТРАНСП – транспонирование матриц,

МОБР – вычисление обратной матрицы.

Для вычисления вектора оценок параметров регрессии  в Exel необходимо выполнить следующие действия:

  1. ввести данные (таб. 2.2);

  2. выделить диапазон ячеек для записи вектора α, соответствующий его размерности (3х1);

  3. используя встроенные в Exel функции, ввести формулу

α = (ХТХ)-1ХТУ,

определяющую вектор α.

4) нажать одновременно клавиши CTRL+SHIFT+ENTER. Появится результат (рис. 2.6).

Рис. 2.6. Результаты вычислений – вектор оценок параметров регрессии .

Таким образом, имеем

0 166,9265419

 = 1 = 1,671226055

2 0,723160336

Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в виде:

Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого момента времени t (табл.2.3).

Таблица 2.3. – Расчетные значения

Набл.

Y

Предск. Y

(t)

2(t)

((t)- (t-1))2

Аi,%

(t)(t-1)

(Y-Yср)2

1

222

224,0687

-2,0687

4,279354

-

0,931829

576

2

223

225,7914

-2,7914

7,792154

0,522415

1,251768

5,774546

529

3

230

230,9145

-0,9145

0,836239

3,523061

0,397592

2,552666

256

4

232

225,2963

6,7037

44,93958

58,03636

2,889525

-6,13027

196

5

232

237,0918

-5,0918

25,92614

139,1331

2,194729

-34,1337

196

6

240

232,0203

7,9797

63,67544

170,8631

3,324871

-40,6308

36

7

240

240,5342

-0,5342

0,285396

72,48674

0,222594

-4,26295

36

8

212

239,9751

-27,9751

782,6048

753,0002

13,19579

14,94498

1156

9

250

264,3954

-14,3954

207,2276

184,4075

5,758161

402,7125

16

10

251

247,0396

3,9604

15,68512

336,9372

1,577866

-57,0122

25

11

254

243,2597

10,7403

115,3531

45,96584

4,228447

42,53619

64

12

254

245,5417

8,4583

71,54322

5,207221

3,330048

90,84455

64

13

259

243,9313

15,0687

227,0643

43,69647

5,818013

127,4555

169

14

264

254,8396

9,1604

83,91205

34,90802

3,46983

138,0342

324

15

264

256,6202

7,3798

54,46125

3,170415

2,795374

67,60144

324

16

266

259,3488

6,6512

44,23786

0,530904

2,500434

49,0841

400

17

220

251,7892

-31,7892

1010,555

1477,663

14,44965

-211,435

676

18

268

263,0287

4,9713

24,71427

1351,339

1,854979

-158,035

484

19

269

267,7596

1,2404

1,53848

13,92029

0,461098

6,16623

529

20

270

266,7538

3,2462

10,53783

4,023428

1,202297

4,026443

576

Σ

4920

4920

0,0000

2797,169

4699,334

71,85489

440,0932

6632

Проведем проверку качества модели. Для начала определим автокорреляцию остатков. Для этого используем d-критерий Дарбина – Уотсона. Для определения величины d-критерия воспользуемся расчетной таблицей 2.3.

Выдвинем гипотезу Но об отсутствии автокорреляции остатков.

d==

Рис. 2.7. График остатков

В качестве критических табличных уровней при n = 20, k=2, при уровне значимости  = 0,05 согласно приложению 3: dL = 1,10 и du = 1,54.

Расчетное значение d = 1,68 попало в интервал от du=1,54 до 4- du =2,46, следовательно нулевая гипотеза подтверждается. Автокорреляция остатков отсутствует. Необходимости проводить дальнейшую проверку с помощью коэффициента автокорреляции первого порядка нет.

3б) Оценим модель через среднюю ошибку аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических. Допустимый предел значений - не более 8 – 10%.

==71,85489/20=3,59

В среднем расчетные значения отклоняются от фактических на 3,59%. Это значение входит в допустимый предел, следовательно, качество построенной модели достаточно высокое.

3в) Вычислим для построенной модели множественный коэффициент детерминации

Множественный коэффициент детерминации показывает долю вариации результативного признака под воздействием включенных в модель факторов Х2 и Х5. Т.о., почти 58% вариации зависимой переменной (объема реализации) в построенной модели обусловлено влиянием включенных факторов Х2 (расходы на рекламу) и Х5 (индекс потребительских расходов).

Проверку значимости уравнения регрессии проведем на основе F-критерия Фишера.

Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.

В нашем примере k1=2; k=20-2-1=17.

Таким образом. Fтабл.=3,59 при =0,05 (приложение 1).

Т.к. Fфакт.> Fтабл., то при заданном уровне вероятности =0,05 следует отвергнуть нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. Необходимо признать уравнение регрессии адекватным.

Значимость коэффициентов уравнения регрессии 1 и 2 оценим с использованием t-критерия Стьюдента:

=

=

Табличное значение t-критерия Стьюдента при уровне значимости 0,05 и степенях свободы (20-2-1)=17 составляет tтабл=2,11 (приложение 2).

Так как t1=1,97 < tтабл=2,11, следует принять нулевую гипотезу о незначимости коэффициента 1.

t2=3,66 > tтабл=2,11, гипотеза о незначимости коэффициента 2.

4. С целью проверки полученных результатов проведем регрессионный анализ выбранной модели с помощью Exel, применив инструмент Регрессия.

Для проведения регрессионного анализа с помощью Exel выполните следующие действия:

1) выберите команду Сервис/Анализ данных;

2) в диалоговом окне Анализ данных выберите инструмент Регрессия. Щелкните по кнопке ОК.

3) в диалоговом окне Регрессия в поле «Входной интервал У» введите адрес диапазона ячеек, который содержит зависимую переменную. В поле «Входной интервал Х» введите адреса одного или нескольких диапазонов, которые содержат значения независимых переменных. Если выделены заголовки столбцов, то установите флажок «Метки в первой строке»;

4) выберите параметры вывода. В поле «Остатки» поставьте необходимые флажки. Щелкните по кнопке ОК.

Сравнивая полученные в п.п. 1,3 результаты с результатами, полученными с помощью Exel (рис.2.8), убеждаемся в правильности выполненных действий.

5. Проанализируем влияние факторов на зависимую переменную

Учитывая, что коэффициенты регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, вычислим соответствующие коэффициенты эластичности, -коэффициенты:

,

Таким образом, при увеличении расходов на рекламу на 1% от своего среднего значения величина объема реализации увеличится на 0,05%, при увеличении потребительских расходов на 1% величина объема реализации увеличится на 0,27%.

Рис. 2.8. Результаты регрессионного анализа, проведенного с помощью Exel.2

Кроме того, по величине -коэффициентов, можем сделать вывод, что наибольшее влияние на изменение объема реализации оказывает фактор Х5 (индекс потребительских расходов), наименьшее Х2 (расходы на рекламу). При увеличении индекса потребительских расходов на 15,5505 ед. объем реализации увеличится на 11 тыс. руб.(0,6019∙18,6829≈11), а при увеличении расходов на рекламу на 3,8043 ед. объем реализации увеличится на 5 тыс. руб. (0,2759∙18,6829≈5).

6. С помощью Exel выберем наилучший вид тренда временных рядов, соответствующих оставленным в модели переменным.

На рис. 2.9 приведен результат построения трендов для временного ряда «Затраты на рекламу». В качестве аппроксимирующей функции выбран полином второй степени – парабола (т.к. по данной модели наибольшее значение у коэффициента множественной детерминации), по которой построен прогноз на два шага вперед. Значение коэффициента детерминации составило R2=0,853, что указывает на то, что весьма большая доля вариации признака Y учтена в модели (более, чем 85% вариации результативного признака объясняется вариацией фактора «затраты на рекламу».

Рис. 2.9. Результат построения тренда и прогнозирования по тренду для временного ряда «Затраты на рекламу»

Аппроксимирующая функция: Х2=7,2449-0,7933t+0,0603t2.

Прогнозные значения на два шага вперед соответственно составляют:

Х2(21)=7,2449-0,7933∙21+0,0603∙212=17,1779,

Х2(22)=7,2449-0,7933∙22+0,0603∙222=18,9775.

Для фактора Х5 «Индекс потребительских расходов» выбираем полиноминальную модель пятой степени (этой модели соответствует наибольшее значение коэффициента детерминации):

Х5 = – 0,0005271347t5 + 0,0333138764t4 – 0,7481642428t3 + 6,9818484692 t2 – 21,4309347217t + 86,0069143467

Прогнозные значения на 21 и 22 периоды соответственно составляют:

Х5(21) = 112,248,

Х5(22) = 114,6053.

Рис. 2.10. Результат построения тренда и прогнозирования по тренду для временного ряда «Индекс потребительских расходов».

7. Для получения прогнозных оценок переменной Y по модели

Подставим в нее найденные прогнозные значения факторов Х2 и Х5, получим:

(21)= 166,9265+1,6712∙17,1779+0,7232∙112,248=276,81195,

(22)= 166,9265+1,6712∙18,9778+0,7232∙114,6053=281,52475.

Доверительный интервал прогноза имеет границы:

верхняя граница прогноза: ,

нижняя граница прогноза: ,

где U(l)=,

Имеем

tкр=2,11 (по таблице при =0,05 и числе степеней свободы 17),

1

Хпр (21)= 17,1779

112,248

1

Хпр (22)= 18,9775

114,6053

Тогда с использованием Exel, имеем

= 0,411376247,

U(l)=12,8273∙2,11∙=17,3595

= 0,469169297

U(l)=12,8273∙2,11∙=18,5388

Результаты прогнозных оценок модели регрессии представим в таблице прогнозов (табл. 2.4).

Таблица 2.4. – Результаты прогнозных оценок модели регрессии

Упреждение

Прогноз

Нижняя граница

Верхняя граница

1

276,81195

259,45245

294,17145

2

281,52475

262,98595

300,06355