Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лабораторных работ 2003.docx
Скачиваний:
77
Добавлен:
12.03.2015
Размер:
8.67 Mб
Скачать
    1. Регрессионный анализ

Регрессионный анализ производится при помощи модуля «Statistics/MultipleRegressions».

В диалоговом окне этого модуля (рис. 5 .122.) при помощи кнопки «Variables» указываются зависимые (dependent) и независимые (independent) переменные.

Рисунок 5.122. Диалоговое окно модуля «MultipleRegressions»

В настройках регрессионного анализа указывается:

  1. Advanced options (stepwise or ridge regression) – пошаговая или гребневая регрессия.

  2. Review descriptive statistics, correlation matrix – описательные статистики, матрицы корреляций.

  3. Extendedprecisioncomputation– вычисления с повышенной точностью.

  4. Batch processing/reporting – пакетная обработка/печать.

  5. Print/reportresidualanalysis– печать результатов анализа остатков.

Множественную регрессию можно проводить пошагово. В этом случае в модель будут пошагово включаться (или исключаться) переменные, которые вносят наибольший (наименьший) вклад в регрессию на данном шаге.

Определим зависимость индекса реального валового внутреннего продукта (ВВП) на душу населения от индекс общественного развития. После того, как все опции диалогового окна регрессионного анализа выставлены, нажатие на кнопку «ОК» приведет к появлению окна представленного на рис. 5 .123, где в поле «Method» необходимо выбрать «Forwardstepwise».

Рисунок 5.123. Выбор метода пошаговой регрессии

По нажатию кнопки «OK» отобразятся результаты регрессионного анализа (рис. 5 .124).

Рисунок 5.124. Окно просмотра результатов регрессионного анализа

В верхней части окна приводятся наиболее важные параметры полученной регрессионной модели:

  1. MultipleR- коэффициент множественной корреляции. Характеризует тесноту линейной связи между зависимой и всеми независимыми переменными. Может принимать значения от 0 до 1.

  2. R2 илиRI- коэффициент детерминации. Численно выражает долю вариации зависимой переменной, объясненную с помощью регрессионного уравнения. Чем большеR2, тем большую долю вариации объясняют переменные, включенные в модель.

  3. adjustedR- скорректированный коэффициент множественной корреляции. Этот коэффициент лишен недостатков коэффициента множественной корреляции. Включение новой переменной в регрессионное уравнение увеличиваетRIне всегда, а только в том случае, когда частныйF-критерий при проверке гипотезы о значимости включаемой переменной больше или равен 1. В противном случае включение новой переменной уменьшает значениеRIиadjustedR2.

  4. adjustedR2 илиadjustedRI- скорректированный коэффициент детерминации. СкорректированныйR2можно с большим успехом (по сравнению сR2) применять для выбора наилучшего подмножества независимых переменных в регрессионном уравнении

  5. F-F-критерий.

  6. df- число степеней свободы дляF-критерия.

  7. p- вероятность нулевой гипотезы дляF-критерия.

  8. Standarderrorofestimate- стандартная ошибка оценки (уравнения).

  9. Intercept- свободный член уравнения.

  10. Std.Error- стандартная ошибка свободного члена уравнения.

  11. t-t-критерий для свободного члена уравнения.

  12. p- вероятность нулевой гипотезы для свободного члена уравнения.

  13. Beta--коэффициенты уравнения.

Это стандартизированные регрессионные коэффициенты, рассчитанные по стандартизированным значениям переменных. По их величине можно сравнить и оценить значимость зависимых переменных, так как -коэффициент показывает на сколько единиц стандартного отклонения изменится зависимая переменная при изменении на одно стандартное отклонение независимой переменной при условии постоянства остальных независимых переменных.

При помощи кнопок диалогового окна «MultipleRegressionsResults» результаты регрессионного анализа можно просмотреть более детально.

Кнопка «Summary: Regression results» - позволяет просмотреть основные результаты регрессионного анализа (рис. 5 .125): BETA - -коэффициенты уравнения; St. Err. of BETA - стандартные ошибки-коэффициентов; В - коэффициенты уравнения регрессии; St. Err. of B - стандартные ошибки коэффициентов уравнения регрессии; t (95) -t-критерии для коэффициентов уравнения регрессии; р-level - вероятность нулевой гипотезы для коэффициентов уравнения регрессии.

Рисунок 5.125. Итоговая таблица регрессии

Таким образом, уравнение регрессии имеет вид:

ID_DEVELOPMENT= 0,269906*ID_VVP+ 0,618848.

Важным элементом анализа является оценка адекватности модели. После того как доказана адекватность модели, полученные результаты можно уверенно использовать для дальнейших действий. Анализ адекватности основывается на анализе остатков. Остатки представляют собой разности между наблюдаемыми значениями и модельными, то есть значениями, подсчитанными по модели с оцененными параметрами.

После нажатия на кнопку «ОК» в окне «MultipleRegressionResult» (рис. 5 .124) на экране появиться диалоговое окно «Residual Analysis» (Анализ остатков) (рис. 5 .126).

Рисунок 5.126. Диалоговое окно «Residual Analysis»

В этом окне на вкладке «Scatterplots» (Разбросы) по кнопке «Predictedvs.residuals» (Предсказательные относительно остатков) можно посмотреть график (рис. 5 .127), который говорить о достаточной адекватности модели.

Рисунок 5.127. График остатков

Примечание

Часто, если остатки не являются нормальными, а также для стабилизации дисперсии применяют преобразования зависимых и независимых переменных, например, извлечение квадратного корня или логарифмическое преобразование зависимых переменных.

В окне, представленном на рис. 5 .126 на вкладке «Scatterplots» (Разбросы) по кнопке «Bivariatecorrelation» (Двумерная корреляция) можно посмотреть графически результат множественной регрессии. Для начала необходимо выбрать переменные для осей, как это сделано на рис. 5 .128.

Рисунок 5.128. Окно выбора осей для построения корреляционного поля

По нажатию на кнопку «ОК» в окне, представленном на рис. 5 .128, на экране появится корреляционное поле, где по оси Xрасположены значения остатков переменной ID_VVP, а по осиY– переменной ID_DEVELOPMENT. Так же на этом графике записано уравнение регрессии для построенной модели и коэффициент корреляции.

Рисунок 5.129. Корреляционное поле для переменных ID_VVPиID_DEVELOPMENT