Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tipovoy_raschet_31.docx
Скачиваний:
7
Добавлен:
24.05.2015
Размер:
519.27 Кб
Скачать

2.5. Выводы

При рассмотрении 25 наблюдений была построена регрессионная модель следующего вида:

26,5 – 0,004x1 – 0,06x2 – 0,33x3 + 0,15x4 – 0,002x5 + 0,05x6

В соответствии с этой моделью можно сделать вывод, что между факторами валовое накопление, ожидаемая продолжительность жизни при рождении и индексом человеческого развития существует прямая связь. А между такими факторами, как ВВП, расходами на конечное потребление, расходами домашних хозяйств, суточной калорийностью питания населения и индексом человеческого развития установилась обратно пропорциональная зависимость.

Согласно результатам дисперсионного анализа, данная модель была признана не адекватной и не пригодной для прогноза. Были намечены пути её оптимизации, которые определились на основании выявленных нарушений предположений <2.1>,<3.1> и <4.2>.

Согласно t-статистки ни один из рассматриваемых параметров не является значимым. На основании этого было принято решение оптимизировать модель за счет выброса из модели t-критериев, имеющих наименьшее значения из всех остальных. К таковым были отнесены t1,t2,t3,t5.

На основе матрицы парных коэффициентов корреляции был произведен отбор наиболее значимых факторов x. Парный коэффициент корреляции rx2x3 при округлении дает значение равное 0,8, что свидетельствует о мультиколлинеарности факторов х2 и х3. Чтобы не допустить дублирования воздействия на отклик, было принято решение устранить из модели фактор х3.

При анализе разброса остатков было определенно, что в модели имеются выбросы, которые выходят за установленный предел (±2). Эти выбросы принадлежат наблюдениям под номерами 18 и 23. Для адаптации модели к нарушению предположения <4.2> данные наблюдения подлежат к их выбросу из построенной модели.

В итоге, после устранения обнаруженных нарушений, был простроен оптимальный вариант регрессионной модели, который имеет следующий вид:

Согласно результатам дисперсионного анализа, данная модель была признана адекватной, но не пригодной для прогноза.

Однако, при анализе качества данной модели, были выявлены нарушения предположений <2.1> и <4.2>. Данное обстоятельство говорит о том, что оптимальный вариант регрессионный модели не был построен. Для того, чтобы добиться этого, следует произвести адаптацию к выявленным нарушениям.

Так предполагается устранить из модели фактор х2 и а, в связи с признанием их статистической незначимости и выбросить из модели наблюдения под номером 13.

Глава 3 - Ответы на контрольные вопросы

  1. Этапы регрессионного анализа.

Экономические показатели функционирования предприятия (отрасли) представляются таблицами эмпирических данных. Один из экономических показателей выделяется в качестве результирующего (у1,..,yi) и изучается влияние на него других показателей как факторов (х1,..,хi). Между случайной величиной результата и случайной величиной фактораимеется случайная зависимость, то есть существует корреляционная зависимость.

Использование статистических данных неудобно из-за большого объема, ненаглядности и необходимости дополнительной обработки. Поэтому такие статистические данные стремятся представить в аналитической зависимости результата от факторов. задача состоит в определении случайной величины результата, если случайные величины факторов, от которых статистически зависит результат, приняли конкретные значения.

Функциональная зависимость результата от факторов представляется уравнением регрессии. А регрессионный анализ представляет собой метод математической статистики, позволяющий восстановить математическую зависимость между зависимой переменной (откликом) Y и множеством независимых между собой регрессоров (факторов) Xj (j=1..p-1).

При проведении регрессионного анализа необходимо выполнить следующие три этапа:

  1. Постулирование модели.

На данном этапе необходимо подобрать такую функцию Y=f(X) из множества параметрических семейств функций Y=f(X,β), которая по какому-либо условию (мере) будет наилучшим образом описывать Y(X).

  1. Оценка параметров множественной регрессии.

Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии.

Так, для уравнения y = a+b1× x1+b2× x2+…+bp× xp+ ε система нормальных уравнений составит:

y n a b1 x1 b2 x2... b p x p ;

yx1 ax1 b1 x1b2 x2 x1 ... b p x p x1 ; (1)

.....................................................................................

yx pax pb1 x1 x pb2 x2 x p... b p x 2 .

Решение данной системы может быть осуществлено методом определителей. Также уравнение множественной регрессии может быть представленной в матричном виде. Его матричная форма имеет вид:

Y=XB+ε, (2)

где ,B =,X = (3)

Процедура оценка параметров b0 =a,b1,b2,…,bk та же, что и в парной линейной регрессии, то есть находим по правилу умножения матрицу X X, обратную матрицу (X X )-1, X Y и далее оценки В, как B ( XTX )1 X Y.

Возможен и иной подход к определению параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение множественной регрессии в стандартизированном масштабе, которое имеет следующий вид:

ty = β1×tx1+ β2×tx2+…+ βp×txp+ε, (4)

где ty,tx1,…,txp – стандартизированные переменные: ;

β – стандартизированные коэффициенты регрессии.

Применив МНК к уравнению множественной регрессии в стандартизированном масштабе, после соответствующих преобразований получим систему нормальных уравнений вида:

(5)

Решая систему (5) методом определителей, найдем параметры – стандартизированные коэффициенты регрессии (β-коэффициенты). Стандартизованные коэффициенты регрессии βi показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результативный признак y за счет изменения соответствующего фактора на одну сигму при неизмененном значении других факторов, закрепленных на среднем уровне. Стандартизованные коэффициенты регрессии βi сравнимы между собой, что позволяет ранжировать факторы по силе их воздействия на результат. Большее относительное влияние на изменение результативной переменной y оказывает тот фактор, которому соответствует большее по модулю значение коэффициента βi.

1

2

3

p

p

p

В парной зависимости стандартизированный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции ryx. Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты «чистой» регрессии bi связаны со стандартизированными коэффициентами регрессии βi ,а именно

bi = βi × (6)

Это позволяет от уравнения регрессии в стандартизированном виде (4) перейти к уравнению регрессии в натуральном масштабе переменных:

= a+b1× x1+b2× x2+…+bp × xp (7)

Параметр а определяется как

.

  1. Свойства МНК-оценок.

В условие yi 01xii (i=необходимо оценить не только 2 параметра модели β0 и β1 в виде b0 и b1, но и числовую характеристику случайной величины ɛ, Ϭ2 через дисперсию. Как случайная величина, ошибка ɛ определяется математическим ожиданием М(ɛi) и дисперсией D(ɛi)= Ϭ2. Оценки b0 и b1 будут обладать следующими свойствами, если они будут определены с помощью МНК:

Теорема Гаусса- Маркова: Если будут выполняться предположения

  1. yi 01xii (i=);

  2. хi – детерминированная величина;

  3. соблюдаются условия:

а) М(ɛi) = 0, D(ɛi) = Ϭ2;

б) М(ɛi, ɛj) = 0 при i≠j –ковариация.

то оценки b0 и b1, полученные МНК имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

  1. Коэффициенты корреляции, детерминации. Назначение и интерпретация.

Важной составляющей процесса построения эконометрической модели является отбор факторов, существенно влияющих на изучаемый показатель и подлежащих включению в разрабатываемую модель. Оптимальный набор факторов определяется на основе качественного и количественного анализа. На этапе постановки задачи и содержательного экономического анализа экономической модели отбираются факторы, влияние которых должно быть учтено при построении модели. Прежде всего, факторы проверяются на наличие тесной линейной корреляционной зависимости между ними. Для этого используют такой показатель как коэффициент корреляции rxy. Формула линейного коэффициента корреляции выглядит следующим образом:

Линейный коэффициент корреляции находится в границах -1≤ rxy ≤ 1. Существование тесной корреляционной зависимости между факторами приводит к получению ненадежных оценок параметров модели. Чем ближе величина rxyк единице, тем теснее линейная связь и тем лучше линейная зависимость согласуется с данными наблюдений. При rxy= 1 связь становится функциональной, т. е. соотношение всех наблюдений. yˆia b xi выполняется для всех наблюдений. При rxy > 0 связь является прямой, при rxy < 0 – обратной. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Данный коэффициент характеризует долю дисперсии результативного признакау, объясняемую регрессией, в общей дисперсии результативного признака:

(10)

Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы

0 ≤ R2 ≤ 1.

Чем больше R2, тем большая часть дисперсии результативного признака y объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между у и x коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии.

  1. Дисперсионный анализ. Цели, задачи, построение ДА.

Дисперсионный анализ – это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. Основной целью дисперсионного анализа является исследование значимости различия между средними с помощью сравнения дисперсий. Задача дисперсионного анализа состоит в анализе зависимой переменной:

, (11)

где - общая сумма квадратов отклонений(SS);

- сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная») (SSR);

- остаточная сумма квадратов отклонений (SSe).

Таким образом, при использовании дисперсионного анализа оценивается влияние фактора х на у, то есть степень адекватности регрессии выборочным наблюдениям.

Результаты дисперсионного анализа представляются в таблице результатов дисперсионного анализа, которая представлена в таблице 8.

Таблица 8 - Таблица результатов дисперсионного анализа.

Источник вариации

Сумма квадратов

Число степеней свободы

Средний квадрат

F-критерий

Регрессия

SSR

m

MSR=

Отклонение от регрессии

SSe

n-m-1

MSe=

-

Общая дисперсия

SS

n-1

-

-

Различают однофакторный и многофакторный дисперсионный анализ. Простейшим случаем дисперсионного анализа является одномерный однофакторный анализ для двух или нескольких независимых групп, когда все группы объединены по одному признаку. В ходе анализа проверяется нулевая гипотеза о равенстве средних. При анализе двух групп дисперсионный анализ тождественен двухвыборочному t-критерию Стьюдента для независимых выборок, и величина F-статистики равна квадрату соответствующей t-статистики.

Многофакторный анализ позволяет проверить влияние нескольких факторов на зависимую переменную. В отличие от однофакторной модели, где имеется одна межгрупповая сумма квадратов, модель многофакторного анализа включает суммы квадратов для каждого фактора в отдельности и суммы квадратов всех взаимодействий между ними.

  1. F-статистика. Способы расчета, назначение.

Для оценки адекватности модели в целом пригодности её для прогноза используют F-статистику:

(12)

Его использование превращается в задачу сравнивания двух дисперсий: дисперсии , обусловленной регрессией и остаточной дисперсией. При этом необходимо установить значима ли часть полной дисперсииDY.

Для этого выдвигается статистическая гипотеза Н0 : β1= β2=…= βp-1=0, то есть гипотеза о том, что в модели yi= β0+ β1×xi1+ β2×xi2+…+βp-1×xi,p-1i, где i=,x1,x2,…,xp-1 не влияют существенно на Y. Вычисляется выборочное значение F-критерия по формуле (12) и сравнивается с табличным значением F-критерия Fтабл (Fтабл (α,p-1,n-p)) и проверяется, выполняется ли неравенство:

FFтабл (13)

При FFтабл гипотеза Н0 (гипотеза о неадекватности модели) принимается. В противном случае (FFтабл) регрессия признается значимой.

На практике также применяется правило: модель считается адекватной и пригодной для прогноза в случае, когда F > 4Fтабл.

При известном значении коэффициента детерминации, значение F-критерия можно рассчитать по формуле:

(14)

В частном случае для парной линейной регрессии формула примет вид:

(15)

  1. Предположения о векторе ошибок.

Матричный вид модели регрессионного анализа выглядит следующим образом:

Y=X×β+ε (16)

Относительно этой модели выдвинуто пять групп предположений. Четвертая группа предположения включает предположения о векторе ошибок:

  1. Ошибки εi являются случайными ошибками, аддитивно входящие в модель. Не является обязательным условием, поэтому можно предположить, что ошибки входят мульпликативно.

  2. Ошибки εi распределены по нормальному закону. Если это так, то в условиях теоремы Гауса-Маркова МНК-оценки дополнительно обладают свойством: являются эффективными для всех классов несмещенных оценок. Кроме того возможно использование статистик для интервального оценивания проверки соблюдения ряда гипотез и качества модели, а также заключение о статистической независимости.

  3. Ошибки εi не содержат системного смещения. При такой гипотезе системные ошибки, вызванные неучтенными эффектами, войдут в β0.

  4. Ошибки εi имеют постоянную дисперсию, то есть наблюдения у1,…,уn некоррелированные и при справедливости предположения 2 из четвертой группы статистически незначимы.

  1. Адаптация к нарушениям по вектору ошибок.

Обычно нарушение предположения <4.1> происходит при переходе от нелинейной по β модели к линейной, и косвенно обнаруживается по явлению гетероскедастичности на графике (di, ) для преобразованной модели.

Явление увеличения или сокращения дисперсии илиxj называется гетероскедастичностью. Для получения ошибок, удовлетворяющие условиям теореме Гаусса-Маркова можно преобразовать и при необходимостиxj, где j=.

Для проверки нарушения <4.2> применяется как графики, так и аналитический способ. График зависимости (di, ) в виде тренда шириной2δ равномерно заполненный на 95%. Помимо адекватности модели свидетельствует о нормальности ошибок. Кроме того, предположение о нормальности нарушается, если наблюдения обременены аномальными выбросами.

Если на графике остатков (di, , хij) за пределами полосы 3δ присутствуют точки, то условие <4.2> следует считать нарушенным. Адаптация к этому нарушению может быть выполнена удалением выбросов, и также дополнительно применяется робастные методы оценивания.

Нарушение <4.3> . Условие М()= 0 не требует особого внимания при наличии β0 в модели. Отличие от нуля, =обычно сигнализирует об ошибках в расчетах.

Нарушение <4.4> . Нарушение условия постоянства дисперсий обычно проверяется по графикам остатков (di, , хij). Выбор адаптации к нарушению <4.4> зависит от возможности описать неоднородность дисперсии аналитическим соотношением или возможностью оценить дисперсии наблюдений. Если можно определить матрицу ковариаций D() после первого приближения МНК, то применяют схему взвешенного МНК.

Для проверки условия независимости ошибок из-за неучета фактора времени, используют графики остатков(d, T), где Т- время или номер наблюдения. По виду кривых делается вывод о необходимости введения линейного или нелинейного слагаемого по Т. Для выявления взаимных корреляций между ei (авторегрессии первого порядка) используют критерий Дарбина-Уотсона. Адаптация к нарушению <4.5> из-за пропуска Т выполняется введением Т (Т2) Если и после этого остается авторегрессия, фиксируемая по D-критерию, то прибегают к обобщенному МНК, используя оценку параметра авторегрессии Р.

  1. Адаптация к нарушениям по вектору оцениваемых параметров. Для модели Y=Xβ+ε условие <2.1> является комплексным и предполагается, что MR-модель линейна по вектору β и с другой стороны по умолчанию принимается, что в модели нет линейных слагаемых и в тоже время не пропущены важные факторы. Способы адаптации к данному нарушению:

  1. Введение качественных (фиктивных) переменных. Предположим, что нарушается последнее предположение, то есть, прощены один или несколько значимых переменных регрессоров. Однако эти переменные имеют качественный характер и принимают два или более дискретных значения. Такие переменные в литературе получили название «фиктивных» переменных. Если мы получили недоопределенную модель, то мы вводим «фиктивные» переменные.

  2. Переход к нелинейной по β модели. Модель, не имеющую такой вид, как y = β0+ β1×z1+…+ βp-1×zp-1, называют нелиненой моделью относительно параметра β.

Специальных признаков нарушения условия <2.2> не существует. Косвенным признаком нарушения могут служить значительные коэффициенты парной корреляции. Адаптация к данному нарушению осуществляется путем учета ограничений на вектор β.

Нарушение условия <2.3> заключается в том, что регрессионная модель не содержит аддитивную постоянную β0. Если модель не содержит данную переменную, то это может являться следствием того, что современные программы предусматривают два режима расчета: с β0 и без него.

  1. Анализ мультиколлинеарности. Почему в модель нежелательно включать мультиколлинеарные факторы? К чему приводит присутствие коллинеарных факторов?

Под мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных. Следствием мультиколлинеарности является линейная зависимость между факторами xij или между столбами матрицы Х. В результате, матрица Х’Х становится плохо обусловленной, что приводит к неустойчивости оценок коэффициентов регрессии, когда незначительные изменения данных наблюдений приводят к значительным изменениям оценок.

Проверка наличия мультиколлинеарности основывается на анализе матрицы парных корреляций между факторами. Пример матрицы парных коэффициентов корреляции представлен на рисунке 11.

Рисунок 11 – Матрица парных коэффициентов корреляции

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если rxixj≥0,7.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы rxixj (xi≠xj) были бы равны нулю. Так, для включающего три объясняющих переменные уравнения

(17)

Матрица коэффициентов корреляции между факторами имела бы определитель, равный 1:

, (18)

так как и

Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0:

. (19)

Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам:

  1. Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл;

  2. Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине и по знаку), что делает модель непригодной для анализа и прогнозирования.

  1. Методы устранения мультиколлинеарности.

Имеется ряд подходов преодоления сильной межфакторной корреляции. Самый простой их них состоит в исключении одного или несколько факторов. другой путь связан с преобразованием факторов, при котором уменьшается корреляция между ними. Например, при построении модели на основе рядов динамики переходят от первоначальных данных к первым разностям уровней, чтобы исключить влияние тенденции, или используются такие методы, которые сводят к нулю межфакторную корреляцию, то есть переходят от исходных переменных к их линейным комбинациям, не коррелированным друг с другом (метод главных компонент).

Одним из путей учета внутренней корреляции факторов является переход совмещенным уравнениям регрессии, то есть к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если y=f(x1,x2,x3), то можно построить следующее совмещенное уравнение:

y=a+b1× x1+ b2× x2+ b3× x3+ b12× x1×x2+ b13× x1×x3+ b23× x3×x2

Рассматриваемое уравнение включает эффект взаимодействия первого порядка. Можно включать в модель взаимодействия более высоких порядков, если будет доказана его статистическая значимость.

Решению проблемы устранения мультиколлинеарности факторов может помочь и переход к уравнениям приведенной формы. С этой цель. В уравнение регрессии подставляют рассматриваемый фактор, выраженный из другого уравнения.

В процедуре отсеивания факторов наиболее широко используется матрица парных коэффициентов корреляции. Показатели частной корреляции, показывая величину тесноты связи фактора с результатом, определяют целесообразность включения в модель того или иного фактора.

  1. Аномальные наблюдения. Выявление, адаптация.

Анализ временных рядов целесообразно начинать с выявления, и если необходимо, то и устранения аномальных, т.е. нехарактерных для данного процесса наблюдений. Причинами возникновения аномальных наблюдений могут быть ошибки первого и второго рода.

К ошибкам первого рода относят ошибки, возникающие при сборе и передаче информации, при агрегировании и дезагрегировании экономических показателей и по другим техническим причинам. Аномальные наблюдения, возникающие из-за ошибок первого рода, подлежат устранению.

К ошибкам второго рода относя ошибки, возникающие из-за воздействия на процесс факторов, имеющих объективный характер, но проявляющих свои экстремальные воздействия крайне редко. Аномальные явления, возникающие из-за ошибок второго рода, устранению не подлежат.

Таким образом, процедура устранения аномальных наблюдений складывается из трех задач:

  1. Обнаружение аномальных наблюдений

  2. Выявление причины их возникновения

  3. Устранение аномальных явлений

Для обнаружения аномальных явлений можно использовать метод Ювлена (рисунок 12).

Рисунок 12

где, Sy – среднеквадратическое отклонение.

Расчетное значение лямбда сравнивается с табличными значениями. Если расчетное значение будет больше табличного, следовательно, данное наблюдение является аномальным.

Выявление причин. Чисто экономический анализ, математических средств нет. Аномальное явление можно устранить путем его замены на среднее значение соседних с ним уровней ряда.

  1. Проверка остатков на гомо- и гетероскедастичность.

Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений), невыполнимость данной предпосылки называется гетероскедастичностью (непостоянством дисперсии отклонений).

Случайные отклонения принимают произвольные значения некоторых вероятностных распределений. Но, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть большим либо меньшим, положительным либо отрицательным, не должно быть причины, вызывающей большие отклонения при одних наблюдениях и меньшие при других. Если дисперсии случайных составляющих неодинаковы в разных наблюдениях: σ2ui ≠ σ2u σ const, i, j = 1;n (i ≠ j), говорят, что имеет место гетероскедастичность (т. е. неодинаковый разброс случайных составляющих).

Гомоскедастичность подразумевает одинаковую дисперсию остатков при каждом значении фактора.

Наличие гомо- и гетероскедастичности наглядно представлено на рисунке 13.

Рисунок 13 – Гомо- и гетероскедастичность

Проверка данных на гетероскедастичность следующими методами:

  • графический анализ остатков;

  • тест ранговой корреляции Спирмена;

  • Тест Гольдфельда-Квандта;

Тест Голдфелда-Квандта состоит в следующем:

  • Все n наблюдений упорядочиваются по величине X.

  • Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k соответственно.

  • Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений). Для парной регрессии Голдфелд и Квандт предлагают следующие пропорции: n=30,k=11; n=60,k=22. Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (рассчитываемая как ) будет существенно меньше дисперсии регрессии по третьей подвыборке (рассчитываемой как).

  • Для сравнения соответствующих дисперсий строится соответствующая F-статистика:

(20) Здесь (k – m - 1)– число степеней свободы соответствующих выборочных дисперсий (m – количество объясняющих переменных в уравнении регрессии). Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = n – m - 1.

  • Если  (где Fкр = Fα,v1,v2, определяется из таблиц, α– выбранный уровень значимости), то гипотеза об отсутствии гетероскедастичности отклоняется. Этот же тест может использоваться при предположении об обратной пропорциональности между σi и значениями объясняющей переменной.

Для множественной регрессии данный тест обычно проводится для той объясняющей переменной, которая в наибольшей степени связана с σi. При этом k должно быть больше, чем (m+1). Если нет уверенности относительно выбора переменной Xj, то данный тест может осуществляться для каждой из объясняющих переменных.

  1. Оценка отсутствия автокорреляции остатков при построении регрессионной модели.

Оценка отсутствия автокорреляции остатков(т.е. значения остатков ei распределены независимо друг от друга). Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между ei и ej , где ei — остатки текущих наблюдений, ej — остатки предыдущих наблю­дений, может быть определен по обычной формуле линейного коэффициента корреляции . (21)

Если этот коэффициент окажется существенно отличным от ну­ля, то остатки автокоррелированы и функция плотности вероят­ности F(e) зависит j-й точки наблюдения и от распределения значений остатков в других точках наблюдения. Для регрессионных моделей по статической информации ав­токорреляция остатков может быть подсчитана, если наблюдения упорядочены по фактору х. Отсутствие автокорреляции остаточных величин обеспечива­ет состоятельность и эффективность оценок коэффициентов ре­грессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динами­ки, где ввиду наличия тенденции последующие уровни динами­ческого ряда, как правило, зависят от своих предыдущих уров­ней.

  1. Проверка неоднородности выборки.

Традиционный метод проверки однородности (критерий Стьюдента). Для дальнейшего критического разбора опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке:

, (22)

затем выборочные дисперсии

,   (23)

и статистику Стьюдента t, на основе которой принимают решение,

.    (24)

По заданному уровню значимости a и числу степеней свободы (m+n 2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t|>tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t|<tкр, то принимают. (При односторонних альтернативных гипотезах вместо условия |t|>tкрпроверяют, что t>tкр; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой здесь.)

Вероятностная модель порождения данных. Для обоснованного применения эконометрических методов необходимо прежде всего построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x1, x2,...,xрассматриваются как результаты mнезависимых наблюдений некоторой случайной величины Х с функцией распределения F(x), неизвестной статистику, а y1, y2,...,yn - как результаты п независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(x), также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми.

Наивысшая степень однородности достигается, если обе выборки взяты из одной и той же генеральной совокупности, т. е. справедлива нулевая гипотеза H0 : F(x)=G(x) при всех х.

Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой H1 : F(x0)¹G(x0) хотя бы при одном значении аргумента x0. Если гипотеза H принята, то выборки можно объединить в одну, если нет - то нельзя.

В некоторых случаях целесообразно проверять не совпадение функций распределения, а совпадение некоторых характеристик случайных величин Х и Y - математических ожиданий, медиан, дисперсий, коэффициентов вариации и др. Например, однородность математических ожиданий означает, что справедлива гипотеза H'0 : M(X)=M(Y), где M(Х) и M(Y) - математические ожидания случайных величин Х и Y, результаты наблюдений над которыми составляют первую и вторую выборки соответственно. Доказательство различия между выборками в рассматриваемом случае - это доказательство справедливости альтернативной гипотезы H'1 : M(X) ¹ M(Y) .

Если гипотеза H верна, то и гипотеза H'0 верна, но из справедливости H' не следует справедливость HВ частности, если в результате обработки выборочных данных принята гипотеза H'0, то отсюда не следует, что две выборки можно объединить в одну. Однако в ряде ситуаций целесообразна проверка именно гипотезы H'

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]