Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Аверьянов В.Е. Исправл. АНУХОВА ЭконометрикаУче...doc
Скачиваний:
34
Добавлен:
12.09.2019
Размер:
1.81 Mб
Скачать

4. 4. Односторонние и двусторонние тесты

Так как будет больше для однопроцентного уровня, чем для 5%-ного (при любом данном числе степеней свободы), то, следовательно, интервал в 99% будет шире интервала в 95%. Так как посредине обоих интервалов лежит величина , то интервал в 99% включает все гипотетические значения в 95%-ном доверительном интервале, а также дополнительные промежутки с той и другой стороны.

Пример:

При оценивании регрессии между расходами на питание и доходом величина составила 0,093, ее стандартная ошибка 0,003, а при 5%-ном уровне значимости 2,069. Отсюда соответствующий 95%-ный доверительный интервал составляет:

, (4.17)

иными словами,

. (4.18)

Поэтому мы отвергаем гипотетические значения только свыше 0,099 и ниже 0,087. Любые гипотезы, не выходящие за рамки этих пределов, не будут опровергаться полученным результатом оценивания регрессии.

Рассмотрение t-тестов мы начали с нулевой гипотезы и провели проверку возможности ее отклонения при коэффициенте регрессии, равном . Если бы мы отклонили эту гипотезу, то косвенно приняли бы альтернативную гипотезу .

До сих пор альтернативная гипотеза была лишь простым отрицанием нулевой гипотезы Если, однако, можно сформулировать альтернативную гипотезу более конкретно, то следует и усовершенствовать процедуру проверки. Проведем исследование трех случаев: первый случай — весьма частный, когда существует единственное альтернативное истинное значение , которое мы обозначим , второй случай — если не равно ; то оно должно быть больше , и третий случай — если величина не равна , то должна быть меньше .

,

В этом случае по каким-то причинам существуют только два возможных истинных значения коэффициента при - и . Для определенности допустим, что , больше, чем . Предположим, что мы хотим проверить гипотезу при 5%-ном уровне значимости и используем для этого обычную процедуру, которая уже рассматривалась в этой главе. Мы находим границы для верхнего и нижнего 2,5%-ных “хвостов” t-распределения, считая, что верна, и обозначим их как и на рис. 4.4. Гипотеза отклоняется, если коэффициент регрессии оказывается правее точки В или левее точки А.

Далее, если значение b находится справа от В, то оно намного лучше совместимо с гипотезой , чем с гипотезой вероятность его нахождения справа от В, если истинна гипотеза , намного больше, чем при истинности гипотезы Здесь у нас не должно быть сомнений в том, чтобы отклонить гипотезу и принять гипотезу

Если, однако, b находится слева от А, то используемая процедура проверки приведет нас к неверному заключению. Последняя требует отклонить гипотезу и, следовательно, принять гипотезу несмотря на то что при истинности гипотезы , вероятность нахождения b слева от А ничтожно мала. Мы даже не построили кривой функции плотности вероятности, соответствующей гипотезе . Если такое значение Ь получается только один раз на миллион случаев при истинности гипотезы , но в 2,5% случаев при истинности гипотезы то здесь намного логичнее считать, что истинной является гипотеза . Конечно, в одном случае из миллиона вы сделаете ошибку, но в остальных случаях вы будете правы.

Следовательно, мы отклоним гипотезу H только если b оказывается в верном 2,5%-ном "хвосте" распределения, т.е. справа от б. Это означает, что теперь мы выполняем проверку гипотезы с односторонним критерием, сократив в результате вероятность допущения ошибки 1 рода до 2,5% Поскольку уровень значимости определен как вероятность допущения ошибки 1 рода, то он теперь также составляет 2,5%.

Как уже отмечалось, экономисты обычно предпочитают проверку гипотез с пяти- и однопроцентным уровнями значимости проверкам с 2,5%-ным уровнем. Если вы хотите провести проверку с 5%-ным уровнем значимости, то вам следует переместить точку S влево так, чтобы получить 5% вероятности в "хвосте" распределения и увеличить вероятность допущения ошибки 1 рода до 5%. (Вопрос: Почему намеренно выбирается увеличение вероятности допущения ошибки 1 рода? Ответ: Потому что одновременно сокращается вероятность допущения ошибки II рода, т.е. вероятность того, что нулевая гипотеза не будет отклонена, когда она является ложной.)

Если стандартное отклонение величины b известно (что практически маловероятно), а распределение нормально, то точка В будет находиться в Z стандартных отклонениях вправо от где Z определяется из соотношения А (Z) = 0,9500 по табл. П.1. Соответствующее значение для Z равно 1,64. Если стандартное отклонение неизвестно и оценивается как стандартная ошибка величины Ь, то мы должны использовать t-распределение. Можно найти критическое значение t по табл. П.2 для соответствующего числа степеней свободы в колонке, относящейся к 5%.

Аналогично, если вы хотите выполнить проверку с однопроцентным уровнем значимости, то вы перемещаете В вправо до той точки, где

Функция плотности

вероятности для b

Рис.4.4 Распределение величины b в соответствии

с гипотезами и

хвост" распределения содержит 1% вероятности. Если вам пришлось. Вычислить стандартную ошибку величины b на основе выборочных данных, то нужно найти критическое значение t в колонке, соответствующей 1%.

В проведенном анализе мы допустили, что больше, чем . Очевидно, что если оно будет меньше , то можно использовать ту же самую логику для проведения односторонней проверки, выбрав левый хвост" распределения в качестве критической области гипотезы .

В данном конкретном случае мы можем вычислить вероятность допущении ошибки II рода, т. е. принятия ложной гипотезы. Предположим, что мы приняли ложную гипотезу и что на самом деле истинно альтернативна гипотеза . Если вернуться к рис. 4.4, то мы примем гипотезу , если коэффициент регрессии выборки b оказывается слева от точки В. Так как гипотеза , истинна, то вероятность того, что b будет отстоять слева от В, описывается областью, которая находится слева от В под кривой функции плотности вероятности, соответствующей гипотезе . Что необходимо сделать — это вычислить t-статистику для точки B, считая, что , и использовать лицу распределения для нахождения вероятности того, что Ь больше, i на t-стандартных ошибок, будет отстоять слева от .

Если эту вероятность обозначить , то мощность критерия, определенная как вероятность недопущения ошибки II рода, составляет (1- ). Очевидно, необходим компромисс между мощностью критерия и уровнем значимости. Чем выше уровень значимости, тем дальше вправо будет сдвинута точка В, тем больше будет  и тем меньше — мощность критерия.

Используя односторонний критерий вместо двустороннего, можно получить большую мощность при любом уровне значимости. Как мы уже видели, при переходе к одностороннему критерию с 5%-ным уровнем значимости точка В на рис. 4.4 сдвигается влево, и тем самым сокращается вероятность принятия ложной гипотезы . Нужно, однако, помнить, что выигрыш в мощности будет получен только в условиях, когда использование одностороннего критерия оправдано

Мы рассмотрели случай, когда альтернативная гипотеза , включала конкретное гипотетическое значение (при ).

Вполне понятно, что логика, которая привела нас к использованию одностороннего критерия, применима и в более общем случае, когда гипотеза , выражается в виде , без указания какого-либо конкретного значения.

Мы по-прежнему хотели бы исключить левый "хвост" распределения из критической области гипотезы, так как низкое значение для b более вероятно получить при гипотезе , чем при гипотезе , а следовательно, это будет говорить в пользу гипотезы , а не против нее. Поэтому мы вновь предпочтем односторонний критерий проверки гипотезы двустороннему, рассматривая, правый "хвост" распределения как область непринятия гипотезы. Отметим, что, так как не определено, у нас теперь нет возможности вычислить мощность такого критерия

Аналогичным образом, если альтернативная гипотеза представлена в виде , мы предпочтем проверку, основанную на «одностороннем критерии, использующем левый "хвост" распределения в качестве области отклонения гипотезы.

Таким образом, односторонний тест- тест на проверку гипотезы, в котором область принятия гипотезы имеет только одно критическое значение, в отличие от двустороннего теста - теста на проверку гипотезы, в котором область принятия гипотезы имеет два критических учения - меньшее и большее.

Подчеркнем также, что меньшее и большее критические значения для двустороннего теста Стьюдента отличаются только знаками. В таблицах введены положительные критические значения.

Односторонний тест Стьюдента применяется, если известна волнительная информация о параметре . Например, если из экономических соображений , то нулевая гипотеза отвергается только при , а при - не отвергается.

Если и - критические значения распределения Стьюдента при р%-ном уровне значимости, то истинное значение параметра с вероятностью (100-р)% находится в (100 - р)%-ном доверительном интервале .

Проверки с использованием одностороннего критерия очень важны на практике при решении экономических задач. Как мы уже видели, обычно для установления того, что независимая переменная действительно оказывает влияние на зависимую переменную, формулируется нулевая гипотеза , которую затем пытаются опровергнуть. Очень часто гипотеза оказывается достаточно общая, чтобы утверждать, что если х оказывает влияние на у, то это влияние имеет определенную направленность.

Если у нас есть достаточно веские причины считать, что это влияние, кем, положительно, то можно использовать альтернативную гипотезу

вместо более общей гипотезы . Это является имуществом, поскольку критическое значение t для отклонения гипотезы Н при проверке по одностороннему критерию будет меньшим, облегчает отклонение нулевой гипотезы и установление наличия зависимости.

Рассмотрим примеры:

При оценивании регрессии расходов на продукты питания мы имели степени свободы. При использовании однопроцентного уровня значимости и двустороннего критерия проверки гипотезы критическое значение t = 2,807. Целесообразно предположить, что размер дохода имеет положительное влияние на уровень расходов на питание. Но тогда для проверки гипотезы можно воспользоваться преимуществами одностороннего критерия, для которого критическое значение имеет меньшую величину, равную 2,500. Причем f-статистика, вычисленная по выборке, равнялась 31,0; поэтому в данном случае улучшение не имеет значения. Оценка коэффициента настолько велика по отношению к стандартной ошибке, что мы отклоняем нулевую гипотезу независимо от того, на каком критерии основывается проверка гипотезы — двустороннем или одностороннем.

В примере зависимости между общей инфляцией и инфляцией, вызванной ростом заработной платы, возможность использования для проверки одностороннего критерия имеет смысл. Нулевая гипотеза состояла в том, что инфляция, вызванная ростом заработной платы, полностью отражена в общей инфляции, и мы имеем . Было бы целесообразно принять альтернативную гипотезу о том, что из-за повышения производительности труда, которое может привести к более низкому уровню общей инфляции по сравнению с инфляцией, вызванной ростом заработной платы, т. е. . В результате расчетов получим коэффициент регрессии, равный 0,82, и стандартную ошибку 0,10; тогда t-статистика для нулевой гипотезы составит -1,80. Это значение не столь велико, чтобы отвергнуть гипотезу Н при 5%-ном уровне значимости и использовании двустороннего критерия (критическое значение составляет 2,10). Однако если мы используем односторонний критерий проверки, то критическое значение уменьшится до 1,73, и теперь мы можем отклонить нулевую гипотезу. Другими словами, можно сделать вывод о том, что общая инфляция будет значимо ниже инфляции, вызванной ростом заработной платы.

4.5. F-тест Фишера на состоятельность регрессии

Даже если между у и х отсутствует зависимость, по любой данной выборке наблюдений может показаться, что такая зависимость существует, возможно и слабая. Только по случайному стечению обстоятельств выборочная ковариация будет в точности равна нулю. Следовательно, только чисто случайно коэффициент корреляции и коэффициент будут в точности равны нулю.

Это представляет для нас проблему. Как узнать, действительно ли полученное при оценке регрессии значение коэффициента R2 отражает истинную зависимость или оно появилось случайно?

В принципе можно было бы принять следующую процедуру. Сформулируем в качестве нулевой гипотезы утверждение, что связь между  и х отсутствует, и найдем значение коэффициента, которое может быть превышено в 5% случаев. Затем используем эту цифру в качестве критического значения для проверки гипотезы при 5%-ном уровне значимости. Если этот уровень превышается, то мы отклоняем нулевую гипотезу. Если он не превышен, то эта гипотеза принимается.

Такая проверка, подобно t -тесту для коэффициента регрессии, не служит доказательством. Действительно, при 5%-ном уровне значимости веется риск допущения ошибки I рода (отклонения нулевой гипотезы, когда она истинна) в 5% случаев, но можно, конечно, снизить этот риск 1% за счет использования более высокого уровня значимости, например в1%. Тогда критическое значение может быть случайно превышено только 1% случаев, поэтому оно выше критического значения для проверки гипотезы при 5%-ном уровне значимости.

Каким образом можно определить критическое значение коэффициента при любом уровне значимости? Здесь возникает небольшая проблема. У нас нет таблицы критических значений коэффициента . Традиционная процедура состоит в использовании косвенного подхода и выполнения так называемого F-теста, косвенного на анализе дисперсии.

F-тест (тест Фишера) - проверка гипотезы (значимость всей регрессии) с помощью распределения Фишера. Тест Фишера односторонний тест.

F-статистика Фишера имеет два числа степеней свободы - верхнее нижнее. Верхнее число - количество объясняющих переменных, в случае парной регрессии = 1, нижнее число - количество наблюдений в уборке минус количество оцениваемых коэффициентов, для парной регрессии = (n -2).

Предположим, что, как и прежде можно разложить дисперсию зависимой переменной на "объясненную" и "необъясненную" "составляющие, воспользовавшись уравнением (2.23а):

.

Используя определение выборочной дисперсии и умножив на п обе части уравнения (3.56), можно представить его следующим образом:

(4.19)

Напомним, что и выборочное среднее значение у равняется выборочному среднему .)

Напомним, что левая часть уравнения представляет собой общую сумму квадратов отклонений (TSS) зависимой переменной от ее выборочного среднего значения. Первый член в правой части уравнения является объясненной суммой квадратов/ESS^, а второй член - необъясненной суммой квадратов отклонений (RSS) который может быть просто назван S:

TSS=ESS+RSS

Формула для F-статистики: , (4.20)

где р - верхнее число степеней свободы, q - нижнее число степеней свободы. Для парной регрессии:

Если F-статистика Фишера превысит критическое значение , то нулевая гипотеза отвергается и регрессия считается значимой.

4.6. Т-тест для выборочного коэффициента корреляции

В I главе мы определили выборочный коэффициент корреляции для двух переменных х и у:

Даже если переменные х и у вообще не коррелированны и теоретический коэффициент корреляции р равен нулю, вы будете связаны известным ограничением и неизбежно получите в расчетах некоторую величину выборочного коэффициента корреляции. Для конкретной выборки может точно равняться нулю только чисто случайно, и можно ли утверждать, что значение действительно указывает на наличие зависимости, или же оно появилось случайно?

Как обычно, ответом будет формулирование нулевой гипотезы о том, что зависимости нет, а затем — попытка ее опровергнуть. Для проверки гипотетической линейной зависимости между х и у, т.е. единственного типа зависимости, который будет рассматриваться в данной книге, справедлива следующая процедура.

Первый шаг состоит в вычислении t-статистики для r:

(4.21)

Выбрав уровень значимости, скажем, в 5%, вы находите критическое значение t с (п - 2) степенями свободы. Если величина t превышает его критическое значение (в положительную или отрицательную сторону), вы отклоняете нулевую гипотезу о том, что , и заключаете, что нашли линейную зависимость (положительную или отрицательную).

Доказательство этого вам уже знакомо. Если нулевая гипотеза верна, то величина t будет превышать его критическое значение (в положительную или отрицательную сторону) только в 5% случаев. Это означает, что при выполнении проверки вероятность допущения ошибки 'рода, отклоняющей нулевую гипотезу, когда она фактически верна, составляет 5%.

Возможно, что риск допущения такой ошибки в 5% случаев слишком велик для вас. Тогда вы можете сократить степень риска, осуществляя расчеты при уровне значимости в 1%. Критическое значение t теперь будет выше, чем до сих пор, поэтому вам потребуется более высокая Положительная или отрицательная f-статистика для отклонения нулевой гипотезы, а это означает, что вам потребуется более высокое значение r.

Обоснованность этого t-теста зависит от того, удовлетворяют ли у и x некоторым условиям. Достаточно будет, чтобы величина убыла, связана c величиной х с помощью модели парной регрессии рассматриваемого типа. Данный тест справедлив только для нулевой гипотезы об отсутствии зависимости. Если вы хотите проверить гипотезу о том, что теоретический коэффициент корреляции вместо нуля равен некоторому другому рачению, то должны будете использовать более сложную процедуру.