Ovsyannikova_M_M_Ekonometrika
.pdfРис. 8
Рис. 9
11
Раздел Регрессионная статистика:
Множественный R – коэффициент корреляции; R-квадрат – коэффициент детерминации;
Нормированный R-квадрат – скорректированный коэффициент детерминации (понадобится для МРА);
Стандартная ошибка;
Наблюдения – количество наблюдений в задаче (если это количество в таблице не совпадает с количеством наблюдений в задаче, то вы неправильно ввели входные интервалы Х и Y или не установили флажок в разделе Метки).
В принципе все эти данные мы уже знаем.
Раздел Дисперсионный анализ
Задача дисперсионного анализа состоит в проверке нулевой гипотезы Н0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.
Данные в таблице дисперсионного анализа располагаются следующим образом:
|
df |
|
SS |
|
|
MS |
|
|
|
F |
|
F-значимость |
|||||
Регрессия |
Количество |
|
ˆ |
|
|
2 |
ˆ |
|
|
2 |
k1 |
|
|
|
R2 |
|
Вероятность |
|
|
|
|
|
|
|
|
||||||||||
|
объясняющих |
∑( y − y ) |
|
∑( y − y ) |
|
Fфакт |
= |
|
xy |
× |
того, что Fфакт |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
− R2 |
|||||
|
переменных |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
сформировалось |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xy |
|
||
|
(k1 = 1) |
|
|
|
|
|
|
|
|
|
|
×(n − k − 1) |
|
случайным об- |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
разом |
Остаток |
k2 = n– k – 1 |
∑ |
( y − yˆ |
) |
|
ˆ |
|
|
|
k2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
∑( y − y ) |
2 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Итого |
Число степеней |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
∑( y − y ) |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
свободы (n – 1) |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Из этой таблицы мы видим, что Fфакт > Fтабл (Fтабл для данной задачи равно 4,96). Следовательно, найденное уравнение регрессии сформировалось не случайно.
Раздел без названия (идет сразу после Дисперсионного анализа)
Столбец Коэффициенты:
–в строке с названием «Y-пересечение» дан коэффициент а уравнения регрессии;
–в строке с названием «х» дан коэффициент b уравнения регрессии.
Столбец Стандартные ошибки:
–в строке с названием «Y-пересечение» дана с.о.(а);
–в строке с названием «х» дана с.о.(b).
Столбец t-статистика:
– в строке с названием «Y-пересечение» дано tфакт(а);
–в строке с названием «х» дано tфакт(b).
Столбец Р-значение:
–в строке с названием «Y-пересечение» дана вероятность того, что параметр а сформировался случайно;
–в строке с названием «х» дана вероятность того, что параметр b сформировался случайно. Столбец Верхние 95 %:
–в строке с названием «Y-пересечение» дана верхняя граница 95 % доверительного интервала параметра а;
–в строке с названием «х» дана верхняя граница 95 % доверительного интервала параметра b. Столбец Нижние 95 %:
–в строке с названием «Y-пересечение» дана нижняя граница доверительного интервала параметра а;
–в строке с названием «х» дана нижняя граница доверительного интервала параметра b.
(Если ноль находится внутри доверительного интервала, то данный параметр незначим.)
Из этой таблицы нам опять же известны некоторые данные, такие как: параметры а и b, стандартные ошибки найденных параметров, которые мы нашли в таблице 5 х 2.
Раздел Вывод остатка
Здесь три столбца:
1) нумерация наблюдений;
12
2) Предсказанное у – теоретические значения переменной Y, т.е. yˆ -значения в этом столбце
должны совпадать со значениями, которые мы посчитали в столбце С (ячейки С2:С13); 3) Остатки – столбец остатков, равный разности между фактическими и теоретическими зна-
чениями переменной Y, e = y − yˆ -значения в этом столбце должны совпадать со значениями, кото-
рые мы посчитали в столбце D (ячейки D2:D13).
А вот доверительные интервалы мы еще не находили, поэтому возьмем их из этой таблицы:
γa = (−0,49;16, 23) , |
γb = (59,31;76, 46) . |
Так как доверительный интервал параметра а содержит нуль, то он незначим, т. е. не имеет реального смысла.
1.6. Выполнить прогноз годового товарооборота для строящегося нового магазина площадью 1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Найдем прогнозное значение yˆ p = 7,87377 + 67,88714xp , где xp = 1. Следовательно, yˆ p ≈ 75,76 . Вычислим среднюю стандартную ошибку прогноза с.о.( yˆ p ):
|
Var(e) |
|
1 |
|
(xp − |
|
)2 |
|
|||
c.o.( yˆ p ) = |
+ |
+ |
x |
= |
|||||||
|
|
1 |
|
|
|
|
|
||||
|
n |
Var(x) |
|||||||||
|
|
n − 2 |
|
|
|
|
25,6 |
|
+ |
1 |
+ |
(1− 0,89)2 |
≈1,7 . |
||||
|
|
1 |
|
|
|
|
||||
10 |
12 |
0,17 |
||||||||
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
Как найти Var(x) и Var(e) с помощью EXCEL 2007: а) поставить курсор в ячейку D18. Ввести Var (x)= ;
б) поставить курсор в ячейку Е18. Ввести знак «=», зайти в мастер функции f(x), выбрать категорию Статистические, выбрать функцию ДИСП, нажать ОК (рис. 10).
Впоявившемся новом окне, где запрашивается число 1, ввести диапазон значений переменной Х, ячейки В2:В13, нажать ОК (рис. 11).
Вячейке Е18 появится число, равное дисперсии переменной Х= Var(x).
Аналогично проделать с вычислением дисперсии значений столбика е (рис. 12).
Строим доверительный интервал (tтабл для данной задачи находим по таблице Стьюдента на пересечении чисел γ = 0,95 (или α = 0,05) и k = 12 – 1 – 1 = 10), у нас это будет число tтабл = 2,23.
yˆ p » 75,76;
Dyˆ p = tтабл ××с.о.( yˆ p ) = 2, 23×1,7 = 3,791; g yˆ p = (71,96; 79,55).
Эти результаты говорят о том, что в новом строящемся магазине площадью 1 тыс. м2 годовой товарооборот предположительно будет находиться в пределах от 71,96 млн. руб. до 79,55 млн. руб.
Рис. 10
13
Рис. 11
Рис. 12
14
1.7. Построить поле корреляции и линию регрессии.
Построим поле корреляции и линию регрессии. Делать это будем все на том же листе Excel, после таблицы Вывод итогов регрессионной статистики или на свободном пространстве после основной таблицы.
Для EXCEL 2003:
1.7.1.В главном меню выбрать Мастер диаграмм (если его нет, то вставить: правой кнопкой мыши нажать по любому разделу главного меню. Выбрать Настройка→ Вставка→ Диаграмма и, держа левую кнопку мыши, перетащить диаграмму в главное меню).
1.7.2.В появившемся окне в разделе Стандартные выбрать тип диаграммы Точечная и нажать кнопку Далее (рис. 13).
1.7.3.В появившемся окне (рис. 14) выбрать раздел Ряд. Щелкнуть по кнопке Добавить, и в строку Имя ввести название первого ряда, в строку Значения Х ввести координаты столбца Х (В2:В13), в строку Значения Y ввести координаты столбца Y (А2:А13).
Рис. 13 Рис. 14
1.7.4. Затем на получившееся поле корреляции можно добавить линию регрессии. Для этого снова щелкните по кнопке Добавить и в освободившиеся три строки введите новые данные: в стро-
ку Имя название нового ряда – yˆ , |
в строку Значения Х – координаты столбца Х (B2:B13), в строку |
Значения Y – координаты столбца |
yˆ (C2:C13). На этом же поле корреляции появятся точки, при- |
надлежащие линии регрессии, они будут розового цвета (рис. 15). Чтобы соединить их в линию, надо щелкнуть по любой точке прямой дважды и в появившемся окне Формат ряда данных в разделе Вид поставить метку того, что линия обычная. Щелкнуть по кнопке ОК (рис. 16).
Для EXCEL 2007:
а) поставить курсор на любое свободное поле; б) в главном меню выбрать Вставка;
в) раскрывшихся окнах выбрать Точечную диаграмму; г) на листе появится белое поле для диаграммы, в верхнем меню появятся новые окна по работе
с диаграммой. Выбираем пункт Выбрать данные. Появится окно (рис. 17);
15
Рис. 15
Рис. 16
16
Рис. 17
д) щелкнуть курсором по кнопке Добавить, в появившемся окне заполнить данные:
– в строку Имя ряда ввести у;
– в строку Значения Х ввести данные столбца Х;
– в строку Значения Y ввести данные столбца Y.
Если в появившейся диаграмме точки соеди- |
|
|
нены между собой ломаной, то нужно в верхнем |
|
|
меню нажать на Изменить тип диаграммы и |
|
|
выбрать Точечную→ ОК. |
Рис. 18 |
|
1.7.5. На рабочем листе появится оконча- |
||
|
тельное поле корреляции с линией регрессии (рис. 20). Его можно перемещать в любое удобное место.
Чтобы добавить в поле корреляции линию регрессии, нужно правой кнопки мыши щелкнуть по полю диаграммы и в появившемся окне выбрать Выбрать данные. Снова появится окно Выбор источника данных. В нем снова щелкаем по Добавить. В появившемся окне (рис. 19) заполнить строки:
–в строку Имя ряда ввести значения столбика ( yˆ );
–в строку Значения Х ввести данные столбца (х);
–в строку Значения Y ввести данные столбца ( yˆ ).
В поле корреляции между нашими фактиче- |
|
скими данными (синие точки) появятся теорети- |
|
ческие данные по нашей выборке. |
|
Чтобы соединить красные точки между собой |
|
в прямую, нужно подвести курсор к любой крас- |
|
ной точке, щелкнуть по ней правой кнопкой мы- |
|
ши, в появившемся окне выбрать Изменить тип |
|
диаграммы для ряда, в появившемся окне вы- |
|
брать тип диаграммы Точечная с гладкими кри- |
|
выми→ ОК (рис. 21). На нашем поле корреляции |
|
появится прямая, проходящая между фактиче- |
Рис. 19 |
скими наблюдениями (рис. 22). |
17
Рис. 20
Рис. 21
18
Рис. 22
19
Раздел 2 ПАРНЫЙ НЕЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
Методические указания
Рассмотрим случай, когда f(x) – нелинейная функция. Нелинейные регрессии делятся на два класса: 1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и 2) регрессии, нелинейные по оцениваемым параметрам. Рассмотрим наиболее часто встречающиеся.
Регрессии, нелинейные по объясняющим переменным:
а) полиномы разных степеней |
f (x) = α + β x + β |
2 |
x2 |
+ e ; |
||
|
1 |
|
|
|||
б) равносторонняя гипербола |
f (x) = α + |
β |
+ e . |
|
|
|
|
|
|
|
|||
|
|
x |
|
|
|
Регрессии, нелинейные по оцениваемым параметрам: в) степенная f (x) = α × xβ × e ;
г) показательная f (x) = α × β x × e и др.
Построение таких уравнений регрессии начинается с их линеаризации.
а) обозначим новые переменные z1 = x, z2 = x2, тогда новое уравнение будет линейным относительно переменных z1, z2: f (x) = α + β1z1 + β2 z2 + e . Для нахождения оценок параметров α , β1, β2 в данном уравнении используется множественный регрессионный анализ (МРА). Мы его рассмотрим позже;
б) обозначим новую переменную z = 1 , тогда новое уравнение примет вид: f (x) = α + β z + e и x
для нахождения оценок параметров α , β применим парный регрессионный анализ (см. раздел 1). Найдем уравнение yˆ = a + bz и вернемся к первоначальной переменной yˆ = a + b / x;
в) для линеаризации данной модели применим метод логарифмирования: lg y = lg(α × xβ × e) . Используя свойства логарифмов, приведем наше уравнение к следующему виду:
lg y = lgα + β lg x + lg e.
|
|
|
Введем новые переменные |
y |
′ |
= lg y , |
α |
′ |
= lg |
α , x |
′ |
= lg x |
′ |
= lg e . Тогда уравнение примет вид |
|||||||||||||||||||
|
|
|
|
|
|
, e |
|||||||||||||||||||||||||||
y |
′ |
= α |
′ |
+ β x |
′ |
′ |
|
оно уже линейно, и для нахождения оценок α |
′ |
||||||||||||||||||||||||
|
|
|
+ e |
, |
, β снова применим линейный рег- |
||||||||||||||||||||||||||||
рессионный анализ. В найденном уравнении |
ˆ |
|
|
|
|
|
|
|
′ |
||||||||||||||||||||||||
y = a '+ bx для найденных коэффициентов a , b выпол- |
|||||||||||||||||||||||||||||||||
ним потенцирование: |
a = 10a′ , b = b. Следовательно, степенное уравнение регрессии будет выгля- |
||||||||||||||||||||||||||||||||
деть так: y = 10 |
a′ |
× x |
b |
; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
г) снова применим метод логарифмирования: lg y = lg(α × xβ × e) и, используя свойства логариф- |
||||||||||||||||||||||||||||||
мов, приведем его к видуlg y = lgα + β lg x + lg e. |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
Введем новые переменные |
y |
′ |
= lg y , |
α |
′ |
= lgα , x |
′ |
= lg x , |
′ |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
e = lg e . Тогда наше уравнение примет |
|||||||||||||||||||||||||
вид: |
y |
′ |
= α |
′ |
+ xβ |
′ |
|
|
′ |
|
Оно линейное, применим линейный регрессионный анализ и в полученном |
||||||||||||||||||||||
|
|
|
|
+ e . |
|||||||||||||||||||||||||||||
уравнении |
|
ˆ |
|
|
|
′ |
|
|
|
|
|
|
|
|
|
′ |
′ |
выполним потенцирование, найдя тем самым коэф- |
|||||||||||||||
|
y = a '+ b x |
для коэффициентов a , b |
|||||||||||||||||||||||||||||||
фициенты a, b: a = 10 |
a′ |
, b = 10 |
b′ |
|
|
|
|
|
|
|
ˆ |
= 10 |
a′ |
×10 |
b′x |
. |
|
||||||||||||||||
|
|
для уравнения y |
|
|
|
|
Формулы аппроксимации, детерминации, проверка статистической значимости коэффициентов уравнения нелинейной регрессии, вычисление прогноза и установка доверительных интервалов проходит по тем же формулам, что и для линейного анализа.
Решение типовых задач
Задача 2. Используя данные задачи 1, требуется:
1)рассчитать параметры степенной регрессии;
2)дать экономическую интерпретацию коэффициентов уравнения регрессии;
3)оценить модель через коэффициенты корреляции, аппроксимации, детерминации;
20