KR1_Lysenko_Ruslan_DEM-202
.docx
Корреляция:
|
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
Y |
1 |
|
|
|
|
|
X1 |
0,437811637 |
1 |
|
|
|
|
X2 |
0,425012278 |
0,87028339 |
1 |
|
|
|
X3 |
0,416511538 |
0,977775277 |
0,8794934 |
1 |
|
|
X4 |
0,577310119 |
0,126362701 |
0,0546325 |
0,044934997 |
1 |
|
X5 |
-0,108231706 |
-0,01370656 |
-0,0441548 |
-0,07360149 |
0,21381427 |
1 |
Факторные признаки Х1, Х2 и Х3 являются мультиколлинеарными. Мультиколлинеарность означает, что существует линейная взаимосвязь между независимыми переменными, а это может сказаться на интерпретации модели: конкретные результаты оценки могут сильно различаться для разных выборок несмотря на то, что выборки однородны. Мультиколлинеарные принаки одновременно в одну модель включать нельзя. Поэтому разобьем исходную модель на 3 модели: y -> x1, x4, x5; y -> x2, x4, x5; y -> x3, x4, x5.
Разбиваем модель на 3:
1: Y->X1, X4, X5
2: Y->X2, X4, X5
3: Y->X3, X4, X5
Каждую модель анализируем при помощи регрессионного анализа в Excel.
|
1 модель |
|
|
|
|||||||
|
Y |
X1 |
X4 |
X5 |
|||||||
1 |
9,7 |
1,59 |
0,32 |
0,14 |
|||||||
2 |
8,4 |
0,34 |
0,59 |
0,66 |
|||||||
3 |
9 |
2,53 |
0,3 |
0,31 |
|||||||
5 |
9,6 |
2,16 |
0,39 |
0,16 |
|||||||
6 |
8,6 |
2,16 |
0,37 |
0,17 |
|||||||
7 |
12,5 |
0,68 |
0,42 |
0,23 |
|||||||
8 |
7,6 |
0,35 |
0,21 |
0,8 |
|||||||
9 |
6,9 |
0,52 |
0,2 |
0,8 |
|||||||
10 |
13,5 |
3,42 |
1,37 |
0,73 |
|||||||
11 |
9,7 |
1,78 |
0,73 |
0,17 |
|||||||
12 |
10,7 |
2,4 |
0,25 |
0,14 |
|||||||
13 |
12,1 |
9,36 |
0,39 |
0,38 |
|||||||
14 |
9,7 |
1,72 |
0,82 |
0,17 |
|||||||
15 |
7 |
0,59 |
0,13 |
0,35 |
|||||||
16 |
7,2 |
0,28 |
0,09 |
0,15 |
|||||||
17 |
8,2 |
1,64 |
0,2 |
0,08 |
|||||||
18 |
8,4 |
0,09 |
0,43 |
0,2 |
|||||||
19 |
13,1 |
0,08 |
0,73 |
0,2 |
|||||||
20 |
8,7 |
1,36 |
0,99 |
0,42 |
|||||||
Регрессионная статистика |
|
|
|
||||||||
Множественный R |
0,719587906 |
|
|
|
|||||||
R-квадрат |
0,517806754 |
|
|
|
|||||||
Нормированный R-квадрат |
0,421368105 |
|
|
|
|||||||
Стандартная ошибка |
1,542441103 |
|
|
|
|||||||
Наблюдения |
19 |
|
|
|
|||||||
|
|
|
|
|
|||||||
Дисперсионный анализ |
|
|
|
||||||||
|
df |
SS |
MS |
F |
|||||||
Регрессия |
3 |
38,32260536 |
12,77420179 |
5,3692867 |
|||||||
Остаток |
15 |
35,68686832 |
2,379124555 |
|
|||||||
Итого |
18 |
74,00947368 |
|
|
|||||||
|
|
|
|
|
|||||||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
|||||||
Y-пересечение |
7,845881568 |
0,786169481 |
9,979885705 |
5,131E-08 |
|||||||
X1 |
0,35220054 |
0,176310672 |
1,99761328 |
0,0642282 |
|||||||
X4 |
3,572370497 |
1,139991443 |
3,133681853 |
0,0068305 |
|||||||
X5 |
-1,919048912 |
1,550635711 |
-1,23758849 |
0,2348918 |
Последовательно исключаем те факторные признаки, Р-значение которых является самым большим из данных – это означает, что коэффициент может считаться нулевым. То есть, соответствующая независимая переменная практически не влияет на зависимую переменную и коэффициент может быть убран из уравнения.
|
Y |
X1 |
X4 |
|||
1 |
9,7 |
1,59 |
0,32 |
|||
2 |
8,4 |
0,34 |
0,59 |
|||
3 |
9 |
2,53 |
0,3 |
|||
5 |
9,6 |
2,16 |
0,39 |
|||
6 |
8,6 |
2,16 |
0,37 |
|||
7 |
12,5 |
0,68 |
0,42 |
|||
8 |
7,6 |
0,35 |
0,21 |
|||
9 |
6,9 |
0,52 |
0,2 |
|||
10 |
13,5 |
3,42 |
1,37 |
|||
11 |
9,7 |
1,78 |
0,73 |
|||
12 |
10,7 |
2,4 |
0,25 |
|||
13 |
12,1 |
9,36 |
0,39 |
|||
14 |
9,7 |
1,72 |
0,82 |
|||
15 |
7 |
0,59 |
0,13 |
|||
16 |
7,2 |
0,28 |
0,09 |
|||
17 |
8,2 |
1,64 |
0,2 |
|||
18 |
8,4 |
0,09 |
0,43 |
|||
19 |
13,1 |
0,08 |
0,73 |
|||
20 |
8,7 |
1,36 |
0,99 |
|||
ВЫВОД ИТОГОВ |
|
|
||||
|
|
|
|
|||
Регрессионная статистика |
|
|
||||
Множественный R |
0,684522313 |
|
|
|||
R-квадрат |
0,468570797 |
|
|
|||
Нормированный R-квадрат |
0,402142146 |
|
|
|||
Стандартная ошибка |
1,56785673 |
|
|
|||
Наблюдения |
19 |
|
|
|||
|
|
|
|
|||
Дисперсионный анализ |
|
|
||||
|
df |
SS |
MS |
|||
Регрессия |
2 |
34,67867806 |
17,33933903 |
|||
Остаток |
16 |
39,33079563 |
2,458174727 |
|||
Итого |
18 |
74,00947368 |
|
|||
|
|
|
|
|||
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
|||
Y-пересечение |
7,341750602 |
0,683484888 |
10,74164291 |
|||
X1 |
0,361370543 |
0,179057506 |
2,018181482 |
|||
X4 |
3,265782993 |
1,131084414 |
2,88730262 |
Аналогично рассматриваем оставшиеся 2 модели.
В результате остаются модели:
Из 1: Y->X1, X4
Из 2: Y->X2, X4
Из 3: Y->X3, X4
Получилось три модели, которые необходимо сравнить. Математически лучшей считается модель, у которой наибольший R2 и наименьший ^S.
С этой точки зрения лучшей является 2 модель, включающая признаки Х2 (число зерноуборочных комбайнов на 100 га) и Х4 (количество удобрений, расходуемых на гектар(т/га).
С экономической точки зрения лучшей из этих моделей является модель, включающая признак, описывающий число зерноуборочных комбайнов на 100 га (Х2), то есть это также 2 модель.
Коэффициент детерминации (показывает долю вариации результативного признака, объясненную вариацией факторного признака) в данном случае равен 0,489 (50%), что говорит о не очень сильной зависимости результативного признака от факторного. Это не очень хорошо, но по сравнению с другими моделями коэффициент этой модели выше.
Y=2,03+20,73*X2+3,42*X4
Коэффициенты эластичности: |
||
Э2 |
0,6176863 |
|
Э4 |
0,1691803 |
|
При увеличении числа зерноуборочных комбайнов на 100 га на 1% урожайность зерновых культур возрастет на 0,62%.
При увеличении количества удобрений, расходуемых на гектар, на 1% урожайность зерновых культур возрастет на 0,17%.