- •Руководство для выполнения контрольной работы по эконометрике
- •Тема 1. Парная регрессия
- •1.1. Линейная парная регрессия
- •1.2. Нелинейная парная регрессия
- •1.2.4 Остаточная сумма квадратов отклонений:
- •1.2.6 Средняя относительная ошибка аппроксимации:
- •1.2.7 Средний коэффициент эластичности:
- •Тема 2. Множественная регрессия
- •Тема 3. Временные ряды
- •Распределение Дарбина-Уотсона
- •Литература
Министерство образования и науки РФ
ГОУ ВПО
Российский государственный торгово-экономический университет
Казанский институт
_______________________________________________________
Кафедра информатики и высшей математики
ТАЛЫЗИН В.А.
Руководство для выполнения контрольной работы по эконометрике
Учебное пособие
КАЗАНЬ-2011г.
Тема 1. Парная регрессия
1.1. Линейная парная регрессия
Расчетные формулы
-
Оценки коэффициентов модели:
, ,
, , , .
-
Выборочные дисперсии и средние квадратические отклонения:
.
-
Выборочный коэффициент парной корреляции:
.
-
Средний коэффициент эластичности:
.
-
Коэффициент детерминации:
.
-
Дисперсионное отношение Фишера (-критерий):
.
-
Остаточная сумма квадратов отклонений:
.
-
Средняя относительная ошибка аппроксимации:
.
-
Стандартная ошибка уравнения регрессии:
.
-
Стандартные ошибки параметров регрессии:
.
1.11 статистики Стьюдента параметров уравнения:
.
1.12 Предельные ошибки коэффициентов уравнения, которые с вероятностью (1-), где уровень значимости, не будут превышены:
.
1.13 Доверительные интервалы для коэффициентов уравнения регрессии:
.
1.14 Стандартная ошибка индивидуального прогнозного значения результирующего признака:
.
1.15 Доверительный интервал для прогнозного значения:
.
Решение типовой задачи.
В таблице 1.1 приводятся данные о заработной плате (, долл.) и возрасте (, лет) по 20 рабочим.
Табл. 1.1
-
300
400
300
320
200
350
350
400
380
400
29
40
36
31
23
45
38
40
50
47
-
250
350
200
400
220
320
390
360
260
250
28
30
25
48
30
40
40
38
29
25
Требуется:
1. Построить поле корреляции и сформулировать гипотезу о форме связи и .
2. Построить линейную регрессионную модель зависимости заработной платы от возраста рабочего, вычислить средний коэффициент эластичности, определить коэффициент детерминации и среднюю относительную ошибку аппроксимации и оценить точность модели.
3. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.
4. Выполнить прогноз заработной платы для 33-летнего рабочего, оценить точность прогноза, рассчитав стандартную ошибку прогноза и его доверительный интервал.
Решение выполним в среде MS Excel.
-
Сформируем расчетную таблицу следующей структуры:
№ п/п |
|||||||||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
|
|
|
|
|
Сумма |
|
|
|
|
|
|
|
|
|
Среднее |
|
|
|
|
|
|
|
|
|
Введем исходные данные , в таблицу по столбцам.
Построим поле корреляции при помощи Мастера диаграмм (тип – Точечная диаграмма) и выполним визуальный анализ типа зависимости.
Поле корреляции
По виду поля корреляции можно сделать вывод о том, что форма связи переменных и может быть как линейной, так и нелинейной.
2. Рассчитаем колонки , , расчетной таблицы. Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).
Выполним расчет параметров уравнения регрессии по формулам 1.1:
, .
В итоге линейная модель имеет вид:
.
Коэффициент регрессии показывает, что в среднем заработная плата растет на доллара при увеличении возраста рабочего на 1 год.
Найдем значения выборочных дисперсий и СКО по формулам 1.2:
, , , .
Определим выборочный коэффициент корреляции по одной из формул 1.3: .
Коэффициент парной корреляции по шкале Чеддока является высоким, что свидетельствует о существенной зависимости з/п от возраста рабочего.
Вычислим средний коэффициент эластичности по формуле 1.4:
.
Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,799%.
Рассчитаем коэффициент детерминации по формуле 1.5:
.
также близок к единице и по нему следует, что з/п на 72% объясняется таким фактором, как возраст рабочего.
Вычислим предсказанные моделью значения з/п по формуле
и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки и их квадраты . В итоге в строке "Сумма" таблицы определится остаточная сумма квадратов .
Проверим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 1.8. Для этого в первой строке колонки набираем с использованием функции ABS(…) формулу: =ABS()*100. После протяжки по всему столбцу вычисляем среднее значение данного столбца:
=.
По видно, что в среднем расчетные значения отклоняются от фактических на 10,2%, что говорит о допустимом качестве модели по этому критерию.
Далее построим график линейной функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.
Поле корреляции с линейной регрессией
3. По формулам 1.9 и 1.10 найдем стандартные ошибки уравнения регрессии и его параметров:
, ,
, .
Рассчитаем статистики Стьюдента по формулам 1.11:
, , .
Обратим внимание на то, что , а .
Найдем с помощью функции СТЬЮДРАСПОБР(…) табличное значение по уровню значимости и числу степеней свободы . Сравнение расчетных значений с табличным указывает на статистическую значимость параметров и . Параметр же не является значимым, поскольку .
Доверительные интервалы строим только для коэффициентов модели, точечные оценки которых являются статистически значимыми. В нашем случае – только для коэффициента регрессии :
; ; ;
.
Рассчитаем критерий Фишера по формуле 1.6:
.
Табличное значение = определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то можно сделать вывод об адекватности построенной модели.
4. Получим прогнозную заработную плату для 33-летнего рабочего по найденной линейной модели:
(долл.).
Вычислим стандартную ошибку прогнозного значения по формуле 1.14:
.
Находим 95% доверительный интервал для прогнозного значения з/п 33-летнего рабочего с использованием формулы 1.15:
,
.
Таким образом, заработная плата 33-летнего рабочего с вероятностью 0,95 находится в пределах от 220,38 до 382,27 долларов.