Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка для индивидуалок по эконометрике.doc
Скачиваний:
53
Добавлен:
14.02.2015
Размер:
2.05 Mб
Скачать

1.2. Типовой пример выполнения индивидуальной работы по теме 1

Задание:

По исходным данным, характеризующим территории региона за 199х год необходимо1:

  1. Построить поле корреляции.

  2. Для характеристики зависимости у от х:

а) построить линейное уравнение парной регрессии у от х;

б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;

в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;

г) дать оценку силы связи с помощью среднего коэффициента эластичности;

д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;

е) оценить статистическую значимость параметров регрессии и корреляции.

3) Проверить результаты, полученные в п.2 с помощью ППП Exel.

4) Рассчитать параметры показательной парной регрессии. Проверить результаты с помощью ППП Exel. Оценить статистическую надежность указанной модели с помощью F-критерия Фишера.

5. Обосновано выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости γ = 0,05.

Решение:

Для нашего примера

Результативный признак (у) – урожайность картофеля, ц/га

Факторный признак (х) – доза внесения органических удобрений, ц/га

Таблица 1.1. – Исходные данные для анализа

№ региона

Доза внесения удобрений, ц/га

х

Урожайность картофеля, ц/га

у

1

97

133

2

79

93

3

86

138

4

77

123

5

104

131

6

69

119

7

100

120

8

93

147

9

81

127

10

102

137

11

74

102

12

90

129

1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (xi yi) (рис.1.1).

Рис. 1.1. Поле корреляции

Расположение точек на графике не позволяет точно определить тип уравнения регрессии. Для выявления типа зависимости воспользуемся экспериментальным методом.

2. Для расчета параметров линейной регрессии построим расчетную таблицу (табл.1.2)

Таблица 1.2. – Расчетные значения

х

у

xy

х2

у2

,

·100%,

(Ai, %)

1

97

133

12901

9409

17689

131,675

0,996

1,755

86,490

45,630

2

79

93

7347

6241

8649

118,625

27,554

656,540

75,690

39,627

3

86

138

11868

7396

19044

123,700

10,362

204,490

2,890

1,488

4

77

123

9471

5929

15129

117,175

4,654

33,931

113,849

59,985

5

104

131

13624

10816

17161

136,750

4,389

33,161

266,669

139,948

6

69

119

8211

4761

14161

111,375

6,408

58,141

348,569

183,467

7

100

120

12000

10000

14400

133,850

11,542

191,823

152,028

79,744

8

93

147

13671

8649

21609

128,775

123,979

332,151

28,408

14,861

9

81

127

10287

6561

16129

120,075

5,453

47,956

44,488

23,474

10

102

137

13974

10404

18769

135,300

1,241

2,890

205,348

107,744

11

74

102

7548

5476

5476

115,000

127,451

169,000

186,868

98,406

12

90

129

11610

8100

16641

126,600

1,860

5,7660

5,429

2,822

Итого

1052

1499

132512

93742

184857

1499,00

325,89

1737,59

1243,20

797,319

Ср.зн

87,67

124,92

11042,67

7811,83

15404,75

х

27,157

σ

10,19

13,1818

σ2

103,97

173,76

2а. Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 2, имеем:

β= ==0,725

a = =124,92-0,725∙87,67=61,35.

Тогда линейное уравнение парной регрессии имеет вид:

Полученное уравнение показывает, что с увеличением дозы внесения органических уравнений на l ц/га урожайность картофеля возрастает в среднем на 0,725 ц/га.

Рис. 1.2. Зависимость между дозой внесения органических удобрений и урожайностью картофеля (линейная регрессия).

Подставляя в полученное уравнение регрессии значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).

2б. При линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.

Учитывая:

,

оценим тесноту линейной связи с помощью линейного коэффициента парной корреляции

Связь между факторами прямая. В соответствии со шкалой Чеддока теснота характеризуется как заметная.

Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.

R2=rху2·100%

R2= 0,562 ∙100%=0,3145

Следовательно, вариация урожайности картофеля на 31,45 % объясняется вариацией дозы внесения удобрений, а остальные 68,55% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.

==325,889/12=27,16%.

В среднем расчетные значения отклоняются от фактических на 27,16%. Это значение значительно превышает допустимый предел, следовательно качество построенной модели невысокое. Это, а также небольшое значение коэффициента детерминации говорит о том, что линейный тип модели не достаточно хорошо отражает представленные эмпирические данные.

2г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:

.===0,5088

Таким образом, в среднем на 0,5% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.

2д) Для оценки статистической надежности результатов используем F-критерий Фишера.

Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.

Fфакт = = · (n-2)

Fфакт==4,5879

Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).

В нашем примере k1=1; k=12-1-1=10.

Таким образом. Fтабл.=4,96 при =0,05.

Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности =0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

2е) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля ==rух =0.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.

Если tтабл  tфакт, то Но отклоняется, т.е. , , r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл  tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования , , r.

; ;

tтабл при уровне значимости =0,05 и числе степеней свободы равных 12-2=10 равно 2,2281 (приложение 2).

< tтабл, <tтабл, <tтабл,

следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии принимается , т. е. r, и статистически незначимы.

Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:

∆ = tтабл m=2,2281∙29,92=66,654

∆ = tтабл m=2,2281∙0,3388=0,7541

Доверительные интервалы:

Для параметра : (-5,304; 128,011)

Для параметра : (-0,029; 1,479)

Анализ верхних и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры  и  находятся в указанных пределах, причем оба параметра являются статистически незначимыми, т.к. в границы доверительного интервала попадает ноль.

3. Проверим результаты, полученные в п.2 с помощью ППП Exel.

Встроенная функция ЛИНЕЙН определяет параметры линейной регрессии. В ходе анализа придерживайтесь следующего порядка вычислений:

  1. введите исходные данные или откройте существующий файл, содержащий исходную информацию для анализа;

  2. выделите область пустых ячеек 52 (5 строк, 2 столбца) для вывода результатов регрессионной статистики;

  3. активизируйте Мастер функций одним из способов:

а) в главном меню выберите Вставка/Функция;

б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;

4) в окне Категория (рис. 1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК.

5) Заполните аргументы функции (рис. 1.4):

известные_значения_у – диапазон, содержащий данные результативного признака;

известные_значения_х – диапазон, содержащий данные факторов независимого признака;

константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член = 0;

Рис. 1.3. Диалоговое окно «Мастер функций».

статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

Щелкните по кнопке ОК.

6) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу <F2>, а затем – на комбинацию клавиш <CTRL>,<SHIFT>,<ENTER>.

Дополнительная регрессионная статистика будет выводится в порядке, указанном в следующей таблице:

Таблица 1.3.– Регрессионная статистика

Значение коэффициента β

Значение коэффициента α

Среднеквадратическое отклонение β

Среднеквадратическое отклонение α

Коэффициент детерминации R2

Среднеквадратическое отклонение у

F– статистика

Число степеней свободы

Регрессионная сумма квадратов

Остаточная сумма квадратов

Рис. 1.4. Диалоговое окно ввода аргументов функции ЛИНЕЙН

3а) Результат вычислений функции ЛИНЕЙН для рассматриваемого примера представлен на рис. 1.5.

Рис. 1.5. Результат вычисления функции ЛИНЕЙН

С помощью инструмента анализа данных Регрессии, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий:

1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите метку Пакет анализа (рис. 1.6).

Рис. 1.6. Подключение надстройки Пакет анализа

  1. в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК.

Рис.1.7. Диалоговое окно Анализ данных

  1. заполните диалоговое окно ввода данных и параметров вывода (рис.1.8):

входной интервал У – диапазон, содержащий данные результативного признака;

входной интервал Х – диапазон, содержащий данные факторов независимого признака;

метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

константа – ноль – флажок, указывающий наличие или отсутствие свободного члена в уравнении;

выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

Рис. 1.8. Диалоговое окно ввода параметров инструмента Регрессия

3б) Проведем анализ исходных данных рассматриваемого примера с помощью инструмента анализа Регрессия (рис. 1.9).

Рис. 1.9. Результаты применения инструмента Регрессия

Сравнивая полученные вручную и с помощью ППП Exel данные, убеждаемся в правильности выполненных действий.

4. Построению показательной модели у=∙х (29) предшествует процедура линеаризации переменных.

Данная функция нелинейна относительно параметров, но линейна по переменным. В нелинейных регрессиях относительно параметров процедура линеаризации производится путем логарифмирования обеих частей уравнения:

ln y = ln+x∙ln (30)

Введем обозначения

У= ln y , С= ln , В= ln

Тогда уравнение (30) запишется в виде:

У= С+ В∙ x. (31)

Для нахождения параметров полученной линейной модели (31) воспользуемся вспомогательными расчетами (табл. 1.4)

Таблица 1.4. – Расчетные величины

х

Y

У∙х

х2

Y2

·%,

1

97

4,890

474,363

9409

23,915

4,877

0,262

0,00017

87,111

0,00327

0,0049

2

79

4,532

358,075

6241

20,54446

4,767

5,175

0,05503

75,111

0,00282

0,0828

3

86

4,927

423,743

7396

24,27783

4,810

2,377

0,01373

2,777

0,00010

0,0114

4

77

4,812

370,538

5929

23,15712

4,755

1,189

0,00328

113,777

0,00427

0,0001

5

104

4,875

507,020

10816

23,76755

4,920

0,927

0,00204

266,777

0,01001

0,0030

6

69

4,779

329,759

4761

22,84002

4,706

1,532

0,00536

348,444

0,01308

0,0017

7

100

4,787

478,749

10000

22,92008

4,896

2,264

0,01175

152,111

0,00571

0,0011

8

93

4,990

464,110

8649

24,90442

4,853

2,754

0,01889

28,444

0,00106

0,0289

9

81

4,844

392,379

6561

23,46615

4,779

1,336

0,00419

44,444

0,00166

0,0006

10

102

4,919

501,838

10404

24,20621

4,908

0,240

0,00014

205,444

0,00771

0,0099

11

74

4,625

342,248

5476

21,39037

4,736

2,412

0,01245

186,777

0,00701

0,0382

12

90

4,859

437,383

8100

23,61778

4,835

0,518

0,00064

5,444

0,00020

0,0016

Σ

1052

57,84

5080,209

93742

279,0075

57,843

20,99

0,12766

1243,200

0,05696

0,14642

Ср.зн

87,67

4,820

423,351

7811,8

23,25062

4,820

1,749

σ

10,1964

0,1129

σ2

103,97

0,0127

Построим линейное уравнение парной регрессии У по х. используя данные таблицы 4, имеем:

=4,820-87,67∙0,0061285=4,285355.

Получим линейное уравнение регрессии:

Ŷ= 4,285+0,0061∙х. (32)

Тесноту полученной линейной модели характеризует линейный коэффициент парной корреляции:

Коэффициент детерминации при этом равен:

R2=r2хУ=0,3067.

Это означает, что чуть более 30% вариации фактора Y объясняется вариацией фактора x.

Средняя ошибка линейной аппроксимации составляет:

=∙100% = 20,992/12=1,15%.

В среднем по полученной линейной модели расчетные значения отклоняются от фактических на 1,15%, что входит в допустимый предел.

Проведя потенцирование уравнения (32), получим искомую нелинейную (показательную) модель.

72,628∙1,006х (33)

Результаты вычисления параметров показательной кривой (1) проверим с помощью ППП Exel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ. Порядок вычислений аналогичен применению функции ЛИНЕЙН.

Сравнивая полученные вручную и с помощью ППП Exel данные, и учитывая тот факт, что в первой строке таблицы (рис.1.10) функция ЛГРФПРИБЛ возвращает коэффициенты показательной модели (29), а остальные параметры соответствуют линейной модели (31), убеждаемся в правильности выполненных действий.

Для расчета индекса корреляции ρxy нелинейной регрессии воспользуемся вспомогательной таблицей 5.

ρxy==.=

Рис. 1.10. Результат вычисления функции ЛГРФПРИБЛ

Таблица 1.5. – Расчетные величины

х

у

1

97

133

131,008

3,967928

65,33974

87,111

2

79

93

117,424

596,5368

1018,676

75,111

3

86

138

122,531

239,296

171,1727

2,777

4

77

123

116,005

48,9366

3,673739

113,777

5

104

131

136,705

32,55268

37,00654

266,777

6

69

119

110,496

72,32147

35,00734

348,444

7

100

120

133,420

180,1

24,17394

152,111

8

93

147

127,860

366,355

487,6721

28,444

9

81

127

118,861

66,24258

4,340139

44,444

10

102

137

135,053

3,791488

146,0061

205,444

11

74

102

113,907

141,7835

525,1751

186,777

12

90

129

125,548

11,91613

16,67334

5,444

Итого

1052

1499

1488,818

1763,8

2534,917

1243,200

Ср.зн

87,67

124,92

124,068

146,983

211,243

103,600

Найдем коэффициент детерминации

R2= ρ2xy·100%=0,55152=0,3042

Полученное значение коэффициента детерминации говорит о том, что 30,42% вариации урожайности картофеля объясняется вариацией фактора х – дозы внесения органических удобрений.

Рассчитаем фактическое значение F-критерия при заданном уровне значимости =0,05:

Fфакт = = · (n-2)==4,37.

Сравнивая табличное Fтабл=4,96 и фактическое Fфакт=4,37 значение отмечаем , что Fфакт.< Fтабл.,

Это означает, что при заданном уровне вероятности =0,05 следует принять нулевую гипотезу о статистической незначимости параметров уравнения регрессии.

5. Так как коэффициенты детерминации, соответствующие линейной и показательной моделям практически равны (около 30% вариации урожайности картофеля объясняется вариацией фактора х – дозы внесения органических удобрений в обеих моделях), то нет весомых оснований отдать предпочтение какой-либо модели.

Кроме того, в виду того, что оба уравнения регрессии является статистически незначимыми и ненадежными, рассчитывать прогнозируемое значение среднедушевого прожиточного минимума в день ни по одному из рассмотренных уравнений не имеет смысла, поскольку данный прогноз не даст достоверного результата.

Тем не менее, для закрепления методики расчета прогнозов, выполним расчет прогнозного значения результата по линейной модели. (R2лин = 0,3145 >R2показ= 0,3042).

По условию задачи прогнозное значение фактора выше его среднего уровня =87,67 на 5%, тогда оно составит:

=1,05∙87,67=92,05

и прогнозное значение урожайности картофеля при этом составит:

=61,35+0,725∙92,05=128,086

Найдем ошибку прогноза:

=

=

Далее строится доверительный интервал прогноза при уровне значимости =0,05:

;

предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

=2,23∙13,8155=30,81

Доверительный интервал прогноза

(61,24; 122,86).