5.5. Тест Бокса – Кокса (решетчатый поиск). Подбор функции методом Зарембки

Возможность построения нелинейных моделей, как с помощью их приведения к линейному виду, так и путем использования нелинейной регрессии, значительно повышает универсальность регрессионного анализа, но и усложняет задачу исследователя. Нужно спросить себя, будете ли вы начинать с линейной зависимости или с нелинейной и если с последней, то какого типа.

Если вы ограничиваетесь парным регрессионным анализом, то можете построить график наблюдений y и x как диаграмму разброса, и это поможет вам принять решение. Часто несколько разных нелинейных функций приблизительно соответствует наблюдениям, если они лежат не некоторой кривой. Однако в случае множественного регрессионного анализа невозможно даже построить график.

При рассмотрении альтернативных моделей с одним и тем же определением зависимой переменной процедура выбора достаточно проста. Наиболее разумным является оценивание регрессии на основе всех постоянных функций, которые можно вообразить, и выбор функции, в наибольшей степени объясняющей изменения зависимой переменной. Если две или более функции подходят примерно одинаково, то вы должны представить результаты для каждой из них.

Из примера в разделе 5.1 видно, что линейная функция объясняет 64% дисперсии y, а гиперболическая функция (4.3) – 99%. В этом примере мы без колебаний выбираем последнюю. Однако если разные функциональные формы, то проблема выбора модели становится более сложной, так как нельзя непосредственно сравнить коэффициенты R² или суммы квадратов отклонений. В частности – и это наиболее общий пример для данной проблемы, - нельзя сравнить эти статистики для линейного и логарифмического вариантов модели.

Значение log y значительно меньше соответствующих значений y, поэтому неудивительно, что остатки также значительно меньше. Величина R², безразмерна, однако в двух уравнениях она относится разным понятиям. В одном уравнении она изменяет объясненную регрессией долю дисперсии y, а в другом – объясненную регрессией долю дисперсии log y. Если для одной модели коэффициент R² значительно больше, чем для другой, то вы сможете сделать оправданный выбор без особых раздумий, однако, если значения R² для двух моделей приблизительно равны, то проблема выбора существенно усложняется.

В этом случае следует использовать стандартную процедуру, известную под названием теста Бокса-Кокса (Box, Cox, 1964). Если вы хотите только сравнить модели с использованием y и log y в качестве зависимой переменной, то можно использовать вариант теста, разработанный Полом Зарембкой (Zarembka, 1968).

Метод Зарембки – процедура выбора между линейной и логарифмическими моделями.

Данный тест предполагает такое преобразование масштаба наблюдений y, при котором обеспечивалась бы возможность непосредственного сравнения суммы квадратов отклонений (СКО) в линейной и логарифмической моделях.

Метод Зарембки состоит из четырех шагов.

1) вычисляется - среднее геометрическое по выборке. Его удобно вычислить как экспоненту от среднего ln y;

2) Наблюдения y пересчитываются: новые ;

3) Рассматриваются линейная регрессия с наблюдениями вместо y_i, и логарифмическая регрессия с наблюдениями вместо ln(y_i). В остальном модели не меняем. Находим остаточные суммы квадратов отклонений для полученных вспомогательных регрессий RSS₁ и RSS₂;

4) Составляем статистику .

Если это число превышает критическое значение распределения с² с одной степенью свободы, то выбираем модель y = axbu, если не превышает – выбираем .

Рассмотрим пример:

Тест будет выполнен как для данных о расходах на продукты питания, так и для данных о расходах на жилье в США, логарифмические регрессии для этих двух видов благ [уравнение (4.18), упражнение 4.1] показали, что среднее значения log y составляют 4,8422 для расходов на питание и 4,6662 для расходов на жилье. Масштабирующие множители равны е^4,8422 и е^4,6662 соответственно. В табл. 4.4 приведены значения СКО для линейной и двойной логарифмической регрессии, при этом использованы то вы должны представить результаты для каждой из них.ор функции, в наибо пересчитанные данные для двух видов благ.

Таблица 5.3

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2421 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.03.2016157.7 Кб12_Бланк КСС.doc
#
11.03.20151.05 Mб153_Неумывакин И. П., Мумиё. Мифы и реальность.doc
#
11.03.2015366.59 Кб1271А1 с ответами.doc
#
22.03.2016179.71 Кб72а1.doc
#
22.03.201654.91 Кб10Абрамов Н.В.rtf
#
12.09.20191.81 Mб34Аверьянов В.Е. Исправл. АНУХОВА ЭконометрикаУче...doc
#
22.03.2016581.12 Кб282Автоматизированный электропривод (Москаленко В.В.)_г.1.doc
#
22.03.2016224.77 Кб188Автоматизированный электропривод (Москаленко В.В.)_г.2.doc
#
22.03.20162.31 Mб502Автоматизированный электропривод (Москаленко В.В.)_г.3.doc
#
22.03.2016907.26 Кб184Автоматизированный электропривод (Москаленко В.В.)_г.4.doc
#
22.03.2016305.66 Кб249Автоматизированный электропривод (Москаленко В.В.)_г.5.doc