- •1.1 Корреляционный анализ данных:
- •1.2 Проверка наличия мультиколлинеарности всего массива переменных:
- •1.4 Проверка наличия мультиколлинеарности каждой переменной
- •1.5 Проверка наличия мультиколлинеарности каждой пары переменных:
- •1.6 Выбор факторных признаков для построения регрессионной модели методом исключения:
- •3. Построение уравнения множественной регрессии
- •Сравнительная оценка силы связи факторов с результатом с помощью коэффициентов эластичности, β- и δ-коэффициентов.
- •Параметры линейной парной регрессии для наиболее подходящего фактора X.
- •Оценка качества построенной модели
- •Ранжирование компаний по степени эффективности.
- •Графики построенных уравнений регрессии (рис. 19):
Чтобы построить диаграммы рассеяния выделим столбцы:
Х2 и Y – вставка – диаграммы – точечная – готово (рис. 1):
Рисунок 1. Зависимость Прибыли (убытка) от краткосрочных обязательств
Х3 и Y – вставка – диаграммы – точечная – готово (рис. 2):
Рисунок 2. Зависимость Прибыли (убытка) от оборотных активов
Х4 и Y – вставка – диаграммы – точечная – готово (рис. 3):
Рисунок 3. Зависимость Прибыли (убытка) от основных средств
Исходя из рисунков, можно сделать вывод, что в модели присутствует гетероскедастичность.
1.1 Корреляционный анализ данных:
Прибыль (убыток) – это зависимая переменная Y (тыс. руб.).
В качестве независимых, объясняющих переменных выбраны:
X2 – краткосрочные обязательства;
X3 –оборотные активы;
X6 –основные средства.
В этом примере количество наблюдений n = 50, количество объясняющих переменных m = 3.
Таблица 2. Результат корреляционного анализа
|
Y |
Х2 |
X3 |
Х6 |
Y |
1 |
|
|
|
Х2 |
0,128311 |
1 |
|
|
X3 |
0,909919 |
0,434219 |
1 |
|
Х6 |
0,839344 |
0,070659 |
0,75762 |
1 |
|
|
|
|
|
Анализ матрицы коэффициентов парной корреляции начнем с анализа первого столбца матрицы, в котором расположены коэффициенты корреляции, отражающие тесноту связи зависимой переменной Прибыль (убыток) с включенными в анализ факторами. Анализ показывает, что зависимая переменная, то есть прибыль (убыток), имеет тесную связь с основными средствами (ryx6 = 0,839) и с оборотными активами (ryx3 = 0,909). Фактор Х2 имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель регрессии.
Затем перейдем к анализу остальных столбцов матрицы с целью выявления коллинеарности. Факторы Х3 и Х6 тесно связаны между собой (= 0,76), что свидетельствует о наличии коллинеарности. Из этих двух переменных оставим Х4 – основные средства, так как rx3y = 0,91 < rx6y = 0,84.
Таким образом, на основе анализа только корреляционной матрицы остаются факторы – Оборотные активы и Основные средства (n = 50, k =2).
Для выявления мультиколлинеарности оставшихся факторов выполняем тест Фаррара–Глоубера по факторам Х2, Х3, Х6.
1.2 Проверка наличия мультиколлинеарности всего массива переменных:
Построим матрицу межфакторных корреляций R1 (табл. 3) и найдем ее определитель det[R1] с помощью функции МОПРЕД.
Таблица 3. Матрица R1
|
Y |
Х2 |
X3 |
Х6 |
Y |
1 |
0,128311 |
0,909919 |
0,839344 |
Х2 |
0,128311 |
1 |
0,434219 |
0,070659 |
X3 |
0,909919 |
0,434219 |
1 |
0,75762 |
Х6 |
0,839344 |
0,070659 |
0,75762 |
1 |
1.3 Вычислим наблюдаемое значение статистики Фаррара–Глоубера:
FG = - (n-1-(2m+5)/6))*LN(R), где
n = 50 – количество наблюдений;
m = 3 – количество факторов.
Ищем определитель матрицы R: f(x) – математические – МОПРЕД – массив (С3:Е5) – ок. Затем находим логарифм определителя матрицы R: f(x) – математические – LN – число R (C7) – ок.
Теперь можно посчитать значение критерия FGнабл:
FGнабл = - (50-1-(2*3+5)/6))* -1,27668
= 60,21656.
Фактическое значение этого критерия FGнабл сравниваем с табличным значением Х2крит при ½m*(m-1) = 3 степенях свободы и уровне значимости 0,05. Табличное значение Х2крит можно найти с помощью функции ХИ2ОБР (табл. 4).
Таблица 4. Нахождение значений для получения FGнабл и Х2крит
определитель |
0,278963 |
|
R |
|
|
|
LN(detR)= |
-1,27668 |
|
FG= |
60,21656 |
|
ХИ2крит= |
7,814728 |
Так как FGнабл > FGкрит (60,21 > 7,81), то в массиве объясняющих переменных существует мультиколлинеарность.