Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика. Лабораторный практикум

.pdf
Скачиваний:
56
Добавлен:
04.06.2015
Размер:
609.78 Кб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

Г. Д. Гефан

Э К О Н О М Е Т Р И К А

ЛАБОРАТОРНЫЙ ПРАКТИКУМ

для студентов специальностей «Бухгалтерский учёт, анализ и аудит», «Финансы и кредит»,

«Мировая экономика»

ИРКУТСК

2008

УДК 519. 24 ББК 22. 172

Г 45

Рецензенты: канд. физ.-мат. наук, доц. О.Д. Толстых (ИрГУПС), канд. техн. наук, доц. А.В. Димов (ИрГУПС).

Гефан Г.Д.

Г45 Эконометрика. Лабораторный практикум. – Иркутск: ИрГУПС, 2008. – 39 с.

Практикум, рассчитанный на 18 часов учебных занятий в компьютерном классе, включает описание 8 лабораторных работ, выполняемых с помощью офисной программы EXCEL.

Библиогр.: 14 назв.

©Гефан Г.Д., 2008

©Иркутский государственный университет путей сообщения, 2008

2

О Г Л А В Л Е Н И Е

ПРЕДИСЛОВИЕ……………………………………………………………… 4

РАБОТА 1.

ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ПО МЕ-

ТОДУ МОНТЕАРЛО…………………………………………………….. 5

РАБОТА 2.

ПАРНЫЙ КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ДАННЫХ..............………………… 10

РАБОТА 3.

ПАРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ……………………………………… 13

РАБОТА 4.

КАЧЕСТВО РЕГРЕССИИ……………………………………………........... 16

РАБОТА 5.

МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ………………………….. 20

РАБОТА 6.

РЕГРЕССИОННЫЙ АНАЛИЗ НЕЛИНЕЙНЫХ ЗАВИСИМОСТЕЙ…………….. 25

РАБОТА 7.

ГЕТЕРОСКЕДАСТИЧНОСТЬ. ОБОБЩЁННЫЙ МЕТОД НАИМЕНЬШИХ КВАД-

РАТОВ…………………………………………………………………… 29

РАБОТА 8.

 

 

МОДЕЛИРОВАНИЕ ДИНАМИКИ. АВТОКОРРЕЛЯЦИОННАЯ ФУНКЦИЯ…….

32

ПРИМЕРЫ ТЕСТОВЫХ ЗАДАНИЙ ПО ЭКОНОМЕТРИКЕ………………………..

35

БИБЛИОГРАФИЧЕСКИЙ СПИСОК......................................................................

37

ПРИЛОЖЕНИЕ 1.

КРИТИЧЕСКИЕ ТОЧКИ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА....…..

38

ПРИЛОЖЕНИЕ 2.

КРИТИЧЕСКИЕ ТОЧКИ РАСПРЕДЕЛЕНИЯ ФИШЕРА......…….

39

3

Предисловие

Эконометрика это наука, возникшая в XX веке на стыке математики, статистики и экономики. Слово “эконометрика” можно перевести как “наука об измерении экономики”. В системе отечественного экономического образования эконометрика появилась лишь в 90-х годах, тогда как среди западных экономистов курс эконометрики давно считался одним из важнейших.

Главное назначение эконометрики – моделирование взаимосвязей между анализируемыми экономическими или социальными показателями. Аналитикостатистические модели, используемые в эконометрике, обычно представлены уравнениями регрессии. Обоснование этих моделей, оценивание их неизвестных параметров и последующее прогнозирование состояния экономики – важнейшие задачи эконометрики.

Данный лабораторный практикум (18 часов учебных занятий) соответствует курсу лекций, читаемых 1 раз в неделю в течение одного семестра (лабораторные работы проводятся 1 раз в 2 недели). 16 часов предназначается для выполнения и защиты работ, ещё 2 часа резервируется для заключительного опроса и подведения итогов. Работы выполняются студентами с помощью офисной программы EXCEL.

Лабораторный практикум опирается на учебное пособие того же автора [14], в котором представлен лекционный курс и расчётно-графические работы. Предполагается, что на занятии группа студентов, работающих на персональных компьютерах, выполняет одно и то же задание под руководством преподавателя, а во время защиты работ каждый студент получает индивидуальные вопросы и небольшие дополнительные задания. Выполнение гораздо более серьёзных расчётно-графических заданий [14] происходит вне аудиторных учебных занятий и основывается на практическом опыте, полученном студентами во время лабораторных работ.

Все описания лабораторных работ имеют ссылки на соответствующие позиции пособия [14]. Каждое описание включает в себя:

1)время для выполнения и защиты работы;

2)цель работы;

3)необходимые, но достаточно краткие сведения из эконометрической теории;

4)задание для работы (иногда несколько заданий);

5)инструкции по выполнению задания;

6)контрольные вопросы.

Предполагается, что студент в той или иной мере знаком по курсу информатики с программой EXCEL, которая, помимо этого, имеет ещё два важных преимущества: это офисная программа, она абсолютно доступна; она является важнейшим рабочим инструментом для будущих экономистов, бухгалтеров, финансистов.

4

Работа 1

Численное моделирование системы случайных величин по методу Монте-Карло

Время на выполнение и защиту 3 часа

Цель работы:

1)повторное (после курса теории вероятностей) рассмотрение характеристик систем дискретных случайных величин;

2)углублённое изучение понятий «корреляция» и «регрессия» на основе проведения численных экспериментов;

3)знакомство с применением метода Монте-Карло к решению вероятностных задач;

4)изучение ряда функций EXCEL.

Сведения о методе Монте-Карло

Методом Монте-Карло называется метод решения различных математических задач при помощи моделирования случайных величин и статистической оценки их характеристик. Название «Монте-Карло» произошло от одноимённого города в княжестве Монако, известного своими казино, ибо одним из простейших приборов для моделирования случайных чисел является рулетка.

Теоретически сам метод возник давно и не раз использовался в теории вероятностей и математической статистике. Однако моделирование случайных величин вручную (например, с помощью той же рулетки, игральной кости, монеты) весьма трудоёмкий процесс. Поэтому серьёзное развитие метод МонтеКарло получил с конца 1940-х годов (в США) с разработкой и совершенствованием компьютеров.

Метод Монте-Карло используется для решения задач физики, теории массового обслуживания, экономики, биологии всё перечислить невозможно.

Задание для лабораторной работы

В данной работе методом Монте-Карло должна быть решена задача, рассмотренная в пунктах 2.2-2.5 пособия [14] в качестве продолжающих друг друга примеров 4-6. Приводим текст этой задачи.

Задание 1.1. На предприятии работают в равном количестве три категории рабочих. Рабочий 1-й категории получает 10 долларов в час, 2-й категории 7 долларов в час, 3-й категории 4 доллара в час. Случайным образом выбираются двое рабочих. Случайная величина X – число рабочих 1-й категории среди двух отобранных, случайная величина Y – суммарная часовая заработная плата двух отобранных

5

рабочих. Исследовать характер связи между случайными величинами X и Y.

Приведём основные понятия и главные результаты, полученные в пунктах 2.2-2.5 [14] с помощью решения, основанного на классической теории вероятностей.

Законы распределения составляющих системы (X и Y)

P(X = xi ) = pij ,

P(Y = y j ) = pij ,

j

i

где вероятности pij = P(X = xi ,Y = y j ) , имеют следующий вид:

 

 

 

 

 

y j

P(Y = y j )

xi

0

1

2

 

P(X = xi )

4/9

4/9

1/9

 

 

 

8

1/9

 

 

 

 

 

11

2/9

 

 

 

 

 

14

3/9

 

 

 

 

 

17

2/9

 

 

 

 

 

20

1/9

Условные законы распределения составляющих:

P(X = xi Y = y j ) = pij / P(Y = y j ),

P(Y = y j X = xi ) =pij / P(X = xi ).

Например, закон распределения Y при условии, что X = 1, выглядит так:

P(Y =14

 

X =1) =

1

, P(Y =17

 

X =1) =

1

.

 

 

2

2

 

 

 

 

 

 

 

Условное математическое ожидание (функция регрессии Y по X):

M (Y X = xi ) = y j P(Y = y j X = xi ) .

j

Было получено: M (Y X = x) = 4.5x +11.

Коэффициент корреляции системы случайных величин:

r(X ,Y ) = M (XY ) M (X )M (Y ) .

σ(X )σ(Y )

(В знаменателе дроби произведение среднеквадратических отклонений). Было получено:

6

M (X ) = 2 / 3;

 

σ(X ) = 2 / 3; M (Y ) =14;

σ(Y ) = 2 3;

M (XY ) =

102

;

r(XY ) =

 

102

28

 

 

3

=

3

0.866.

 

 

 

 

 

 

 

 

9

9

3

4

2

 

 

 

 

 

 

 

 

 

Смысл настоящей работы состоит в том, чтобы, моделируя систему случайных величин с помощью генератора случайных чисел, получить (на основе случайных выборок объёма 1000) статистические оценки характеристик этой системы и убедиться в том, что они (оценки) достаточно близки к истинным значениям оцениваемых характеристик. Таким образом, вероятностная задача заменяется задачей статистической, в чём и состоит суть метода Монте-Карло.

Инструкция по выполнению задания

1. Создайте в рабочем листе EXCEL следующую таблицу:

 

A

B

C

D

E

F

G

1

№ ис-

Категория 1

Категория 2

Зарплата 1

Зарплата 2

X

Y

 

пытания

рабочего

рабочего

рабочего

рабочего

 

 

2

 

 

 

 

 

 

 

В первом столбце таблицы должен стоять номер испытания. Введите в ячейку A2 формулу

=1.

В ячейку A3 введите формулу

=A2+1.

Адрес (в данном случае A2) удобнее набирать не с клавиатуры, а щёлкая мышкой по нужной ячейке.

В последующие ячейки этого столбца будет вводиться аналогичная формула с помощью автозаполнения. Однако эту операцию удобнее провести не для каждого столбца в отдельности, а для столбцов A-G разом. Пока же продолжим формирование строки 2.

2. Во втором и третьем столбцах должны находиться категории двух случайно выбранных рабочих – случайные числа (1, 2, 3 с равной вероятностью). Используем функцию СЛЧИС () из списка математических. Эта функция даёт равномерно распределённую в интервале (0; 1) случайную величину. Формула =3*СЛЧИС()+1 будет давать равномерное распределение в интерва-

ле (1; 4).

Функция ОТБР(…) из списка математических отбрасывает часть числа после запятой. Таким образом, формула

7

=ОТБР(3*СЛЧИС()+1)

будет давать именно то, что нужно (числа 1, 2, 3 с равной вероятностью).

3. Зарплату рабочих можно задавать с помощью функции ЕСЛИ (логическое выражение; значение, если истина; значение, если ложь)

из списка логических функций. По условию задачи будет: =ЕСЛИ (КАТ=1; 10; ЕСЛИ (КАТ=2;7;4)),

где вместо «КАТ» необходимо поставить соответствующий адрес ячейки.

4. Значение X (число рабочих 1-й категории) можно вычислить с помощью функции

СЧЁТЕСЛИ (диапазон с категориями; 1)

(из списка статистических функций), а значение Y (суммарный заработок) – с помощью функции

СУММ (диапазон с зарплатами)

(из списка математических функций). Подчеркнём, что значения X и Y опре-

деляются по двум рабочим, отобранным в данном испытании. Поэтому каждый из диапазонов (с категориями и с зарплатами) будет включать в себя всего лишь по 2 ячейки.

5.Выделим диапазон B2:G2. Подведём курсор к правому нижнему углу ячейки G2 так, чтобы он принял вид чёрного крестика, нажмём на левую кнопку мыши и, удерживая её, выделим ячейки B3:G3 (автозаполнение).

Теперь выделим диапазон A3:G3 и c помощью автозаполнения «растянем» таблицу до 1000-го номера испытания.

6.В последней строке таблицы поместим средние значения величин с помощью функции СРЗНАЧ (диапазон) из списка статистических функций. Для этого достаточно ввести эту функцию только в ячейку столбца B и с помощью автозаполнения «растянуть» вправо.

Убедитесь, что средние значения X и Y близки к математическим ожиданиям M (X ) и M (Y ), приведённым выше. Что касается других средних, то

легко догадаться, что средние зарплаты должны быть близки к значению

13 (4 + 7 +10) = 7 ,

асредние значения категорий близки к 2.

7.Когда таблица велика и не помещается на экране, удобно закрепить строку заголовков. Для этого щёлкните по ячейке A2, войдите в меню Окно и

8

выберите Закрепить области. Теперь, даже если вы переместитесь вниз таблицы, названия столбцов останутся на экране.

8. Угловой коэффициент a функции регрессии Y по X M (Y X = x) = ax +b

оценивается с помощью функции НАКЛОН (диапазон значений Y; диапазон значений X) из статистических функций.

9. Свободный член b функции регрессии можно оценить, как

b* = y a* x ,

где звёздочка обозначает оценку.

10.Коэффициент корреляции оценивается с помощью функции КОРРЕЛ (массив 1; массив 2) из списка статистических функций. В качестве аргумен- тов-массивов нужно задать диапазоны с ячейками, содержащими значения X и Y (в отличие от функции НАКЛОН здесь порядок аргументов не важен).

11.Щелчком мыши активизируйте любую свободную ячейку рабочего листа и раз за разом нажимайте на клавишу Delete. При каждом нажатии будет генерироваться новая парная выборка объёма 2 ×1000 , и, следовательно, будут появляться новые значения оценок характеристик системы.

В силу высокой репрезентативности выборки эти значения будут меняться очень слабо, и каждый раз будут достаточно близки к истинным значениям характеристик. Убедитесь, что это действительно так.

Дополнительное задание

Задание 1.2. Игральная кость бросается дважды. X – число выпавших шестёрок, Y – сумма выпавших очков. Исследовать функцию регрессии Y по X и корреляционную связь случайных величин методом МонтеКарло, генерируя случайные парные выборки объёма 2 ×100 .

Контрольные вопросы

1.Почему оценки математических ожиданий, коэффициентов регрессии и корреляции в задании 1.1 получаются гораздо более стабильными и близкими к истинным значениям вероятностных характеристик, чем в задании 1.2? С какими свойствами статистических оценок это связано?

2.Почему коэффициент корреляции в обоих заданиях оказывается положительным?

3.Что произойдёт с коэффициентом корреляции, если случайная величина X в задании 1.2 будет не числом выпавших шестёрок, а:

числом единиц?

числом троек?

Проверьте свои предположения численным экспериментом.

9

4.Что произойдёт с коэффициентом регрессии a в задании 1.1, если рабочим всех категорий установить одинаковую зарплату?

5.Используя оценки коэффициентов регрессии, предскажите суммарный заработок двух отобранных рабочих (задание 1.1), если известно, что ровно один из них имеет 1-ю категорию.

Работа 2

Парный корреляционный анализ данных

Время на выполнение и защиту 1 час

Цель работы:

1)проведение корреляционного анализа несгруппированных данных с помощью известных формул;

2)построение диаграмм рассеивания по данным наблюдений;

3)изучение функций EXCEL, применяемых для корреляционного анализа.

Что такое корреляционный анализ?

Задачи, рассмотренные в работе 1, допускали чисто теоретическое исследование на основе теории корреляции, поскольку в этих случаях было возможно построение совместного закона распределения случайных величин. Исследование по методу Монте-Карло лишь подтвердило эти теоретические результаты.

В других случаях (примеры 2 и 3 пособия [14]) исследование корреляционной связи должно основываться на статистических данных, полученных выборочным методом. Такое исследование называют корреляционным анализом. Его цель – измерить, насколько велика сила зависимости между признаками, или, как говорят статистики, насколько тесно коррелированы эти признаки.

Задание для лабораторной работы

Задание 2.1. Имеются данные об издержках 30 магазинов фирмы, торгующей как промышленными, так и продовольственными товарами. (Данные в таблице размещены в 9 столбцах лишь для экономии места – в таблице EXCEL разместите их в 3 столбцах). Требуется провести корреляционный анализ связи этих издержек (Y, в рублях на 1 тысячу рублей оборота) с долей промтоваров в обороте (X, %).

10