Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Малый бизнес (госрегулирование).docx
Скачиваний:
21
Добавлен:
02.02.2020
Размер:
363.03 Кб
Скачать

2.2 Корреляционно-регрессионный анализ зависимости основных показателей малого предпринимательства от показателей развития регионов рф

В данном разделе определим тесноту взаимосвязи между постоянными и переменными величинами методом корреляционно-регрессионного анализа. Для начала обозначим показатели развития регионов РФ и показатели государственного регулирования – независимые переменные (Х) и показатели малого и среднего предпринимательства регионов РФ – зависимые переменные (У).

К независимым переменам (Х) относятся следующие показатели:

1. Валовый региональный продукт за год на 100000 чел., млн. руб.(Х1)

2. Инвестиции в основной капитал на 100000 чел., млн. руб.(Х2)

3. Инфляция средняя, %.(Х3)

4. Динамика курса валютной пары доллар\евро по отношению к российскому рублю.(Х4)

5. Ставка рефинансирования Центрального Банка Российской Федерации на начало года.(Х5)

К зависимым переменам (У) относятся следующие показатели:

1. Число малых предприятий на 10000 человек населения региона.(У1)

2. Сальдированный финансовый результат (прибыль минус убыток) малых предприятий, тыс. руб.(У2)

Затем рассмотрим выбранные нами зависимые и независимые переменные в динамике, начиная с 2005 г. и заканчивая 2016 г. (Приложение 2).

Далее последовательно построим корреляционные поля и уравнение регрессии для каждой из зависимых переменных для каждого региона.

1. Начнем с Московского региона.

Первым делом представим корреляционные поля для Y1 в паре с каждой из независимых переменных. Так, на Рис. 1 представлено корреляционное поле пары Х1 и Y1.

Рис. 1 Корреляционное поле Х1Y1

Из данного рисунка можно видеть, что связь между Х1 и Y1 прямая, а коэффициент детерминации R2 показывает, что степень этой связи, между Валовым региональным продуктом Московской области и числом малых предприятий, составляет около 52,8 % и является средней.

Ниже, на Рис. 2, представлено корреляционное поле пары Х2 и Y1.

Рис. 2 Корреляционное поле Х2Y1

Обратив внимание на данный рисунок, можно сделать вывод, что связь между независимой переменой Х2 и зависимой переменной Y1, так же, как и в случае с парой Х1Y1, является прямой. А степень этой связи уже меньше, чем между Х1 и Y1, и является средней, составляя около 48,9%, что показывает коэффициент детерминации R2.

Дальше обратим внимание на корреляционное поле следующей пары переменных, а именно Х3 и Y1, которое представлено на Рис. 3.

Рис. 3 Корреляционное поле Х3Y1

Анализируя данное корреляционное поле, можно заметить, что связь между представленными переменными является обратной. А вот зависимость Y1 от переменной Х3 очень низкая, что опять же показывает коэффициент детерминации R2. Таким образом, уже сейчас можно предположить, что среднегодовой уровень инфляции слабо влияет на численность малых предприятий в Московской области, и использовать данный показатель при построении уравнения регрессии не придется.

Еще одно корреляционное поле, а именно пары переменных Х4 и Y1, представлено на Рис.4.

Рис. 4 Корреляционное поле Х4Y1

Из данного рисунка отчетливо видно, что связь между такими показателями, как «динамика курса валютной пары доллара\евро по отношению к российскому рублю» и «число малых предприятий», является прямой, что наглядно показывает построенная линия тренда. Но при этом, основываясь на значении коэффициента детерминации R2, зависимость переменной Y1 от Х4 так же является довольно низкой и составляет около 29%.

Последнее корреляционное поле, которое мы рассмотрим в рамках анализа переменной Y1, представлено на Рис. 5.

Рис. 5 Корреляционное поле Х5Y1

Линия тренда, показанная на данном рисунке, показывает, что связь между переменными Х5 и Y1 является обратной. Коэффициент детерминации R2, в свою очередь, указывает на то, что зависимость Y1 от переменной Х5 является средней и составляет около 41,4%.

Теперь, когда были представлены все корреляционные поля, показывающие связь между зависимой переменной Y1 и всеми независимыми переменными Х, необходимо построить корреляционную матрицу, которая позволит отобрать показатели, которые имеют наибольшую связь с зависимой переменной, что позволит построить уравнение регрессии, учитывая при этом наличие линейной зависимости (мультиколлинеарность) между независимыми переменными Х.

Таким образом, в ходе проведенных расчетов и проделанного анализа, была построена следующая корреляционная матрица, которая представлена на Таблице 3.

Таблица 3

Корреляционная матрица

Используя шкалу Челдока, при анализе построенной корреляционной матрицы, можно определить, какие из показателей имеют набольшую связь с зависимой переменной Y1. Согласно данной шкале связь бывает:

1) очень сильная- показатели от +/- 0,7 до +/-1;

2) средняя- показатели от +/-0,3 до +/-0,699;

3) очень слабая- от 0 до +/-0,299.

Для уравнения регрессии необходимо отобрать показатели, которые имеют очень сильную и среднюю связь с переменной Y1. Таким образом, анализируя данную матрицу, видно, что сильная или средняя связь с Y1 наблюдается у следующих показателей: Х1, Х2, Х4 и Х5. Но прежде чем строить уравнение регрессии, необходимо проверить отобранные показатели на мультиколлинеарность. Для этого, основываясь на все той же шкале Челдока, определим степень связи между Х1 и остальными отобранными показателями. Если связь будет очень сильной, то это указывает на наличие мультиколлинеарности между переменными, поэтому один из показателей, чья связь слабее с Y1, использоваться в дальнейшем построении уравнения регрессии не будет. Итак, анализируя значения, представленные в корреляционной матрице, можно заметить, что связь между Х1 и такими переменными, как Х2 и Х4 очень сильная, что свидетельствует о наличии между ними мультиколлинеарности. Поэтому, при построении уравнения регрессии, будет использоваться показатель Х1, так его связь с Y1 наиболее сильная, чем у Х2 и Х4. При построении уравнения так же будет использоваться и показатель Х5, так связь между ним и Х1 является средней, на основе чего можно сделать вывод, что между ними нет линейной зависимости. Правильность сделанных выводов так же подтверждают линия тренда и коэффициент детерминации R2, которые представлены на выше построенных корреляционных полях.

Итак, отобрав показатели, между которыми не наблюдается наличие мультиколлинеарности, и связь которых с Y1 является сильной или средней, можно построить уравнение регрессии. В ходе проведенных расчетов, которые представлены в Приложении 1, было построено следующие уравнение регрессии: Y= 97,247+ 0,000917Х1- 3,042Х2 .

Теперь, для более полного и глубокого анализа, необходимо обратить внимание на такие факторы, как t-статистика и p-значение. Первым делом разберемся с t-статистикой. Т-статистика, или по-другому критерий Стьюдента, используют чтобы проверить значимость каждого параметра в построенном уравнение. В ходе проведения соответствующих расчетов, были получены следующие значения t-статистики для каждого из параметров уравнения:

1) Параметр «а» (97,247): t-статистика= 2,542;

2) Параметр «в1» (0,000917): t-статистика= 1,903;

3) Параметр «в2» (- 3,042): t-статистика= -1,088.

Для того, чтобы определить значимыми ли являются данные параметры, необходимо сравнить их с табличным значением t-статистики. Согласно эконометрической теории tтабл.= ta/2; n-m-1, где: a- это уровень значимости, который рассчитывается, как разность между 1 и доверительной вероятностью, которую, в научном сообществе принято брать равной 0,95, объясняя это тем, что существует 95% вероятность того, что полученные результаты были не случайны; n- это количество выборки; m-это количество учитываемых объясняющих (независимых) переменных Х. Таким образом, в данной работе tтабл= t0,025; 9. Согласно таблице «Распределение Стьюдента», которая представлена в Приложении 3, tтабл= 2,262. Согласно все той же эконометрической теории, если расчетная t-статистика больше, чем tтабл, то параметр уравнения значим. Учитывая все выше изложенное, получаем следующие результаты:

1) Параметр «а» значим, так как t-статистика= 2,542 больше, чем tтабл= 2,262;

2) Параметр «в1» незначим, так как t-статистика= 1,903 меньше, чем tтабл= 2,262;

3) Параметр «в2» незначим, так как t-статистика= -1,088 (если брать по модулю) меньше, чем tтабл= 2,262.

Дальше стоит пояснить, что представляет из себя p-значение. Данное значение позволяет сделать вывод касательного того, оказывают ли переменные уравнения регрессии достаточный эффект на получаемые в итоге результаты. Для этого p-значение необходимо сравнить с уровнем значимости, что покажет, будут ли результаты, полученные в ходе использования построенного уравнения, случайными или нет. В соответствии с эконометрической теорией, если p-значение меньше, чем уровень значимости, то можно констатировать, что связь между переменными и полученными результатами есть, то есть они не случайны. Как уже отмечалось выше, уровень значимости, в научном сообществе, обычно берется равным 0,05, так как доверительная вероятность равна 0,95. Таким образом, получаем следующие результаты:

1) p-значение параметра «а» равно 0,0316, что меньше уровня значимости (0,05). Значит связь между данным параметром и результатами есть, то есть они не случайны;

2) p-значение параметра «в1» равно 0,0894, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем;

3) p-значение параметра «в2» равно 0,3047, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем.

Теперь, когда был проведен полный корреляционно-регрессионный анализ зависимой переменной Y1, можно приступать к аналогичному анализу переменной Y2. Первым делом рассмотрим корреляционные поля данной переменной с каждой из независимых переменных Х. На Рис. 6 представлено корреляционное поле пары переменной Х1 и Y2.

Рис. 6 Корреляционное поле Х1Y2

Итак, анализируя данный рисунок, можно сказать, что связь между переменными Х1 и Y2 является прямой, на что указывает линия тренда. В свою очередь, коэффициент детерминации R2 показывает, что зависимость переменной Y2 от переменной Х1 является довольно низкой и составляет около 26%.

Корреляционное поле следующей пары переменных, а именно Х2 и Y2, представлено на Рис. 7.

Рис. 7 Корреляционное поле Х2Y2

Линия тренда, которая изображена на данном рисунке, показывает, что связь между переменными Х2 и Y2 так же является прямой. При этом зависимость Y2 от переменной Х2 является средней, на что указывает коэффициент детерминации R2., и составляет около 55%, что больше половины.

Далее, на Рис. 8, представлено корреляционное поле еще одной пары переменных, а именно Х3 и Y2.

Рис. 8 Корреляционное поле Х3Y2

Линия тренда данного корреляционного поля показывает, что связь между двумя указанными переменными является прямой, так же, как и в предыдущих парах Y2 и Х. Тем не менее, зависимость Y2 от переменной Х3 является очень низкой и составляет всего 0,3%, что отображает коэффициент детерминации R2, представленный на рисунке.

Четвертое корреляционное поле, относящееся к корреляционно-регрессионному анализу зависимой переменной Y2, представлено на Рис. 9.

Рис. 9 Корреляционное поле Х4Y2

Связь между указанными переменами так же является прямой, аналогично типам связи, представленными на предыдущих корреляционных полях. При этом зависимость Y2 от переменной Х4 довольно слабая и составляет около 12%, что отражает все тот же коэффициент детерминации R2.

Корреляционное поле последней пары переменных, а именно Х5 и Y2, представлены на Рис. 10.

Рис. 10 Корреляционное поле Х5Y2

Анализируя данный рисунок можно заметить, что связь между указанными переменными, представленной в виде линии тренда, является обратной, что отличает это корреляционное поле от предыдущих. Так же, зависимость переменной Y2 от переменной Х5 меньше 50%, но при этом не настолько низкая, как в предыдущих парах переменных.

Теперь, когда были построены и представлены все корреляционные поля, необходимо отобрать наиболее значимые для уравнения регрессии независимые переменные Х. Как и при анализе Y1, для этого построим корреляционную матрицу, которая представлена в Таблице 4.

Таблица 4

Корреляционная матрица

Анализируя данную корреляционную матрицу, используя при этом всю ту же шкалу Челдока, отбираем те показатели, которые имеют очень сильную и среднюю связь с зависимой переменной Y2. Из приведенной выше таблицы видно, что сильную и среднюю степень связи с зависимой переменной имеют следующие показатели: Х1, Х2, Х4 и Х5. Теперь, среди указанных переменных, необходимо отобрать те, которые будут использоваться при построении уравнения регрессии, учитывая при этом мультиколлинеарность между ними. Для этого, с помощью шкалы Челдока, необходимо установить степень связи всех переменных Х с переменной Х1 и убрать те, с которыми наблюдается сильная связь. Обратив внимание на корреляционную матрицу, можно увидеть, что сильная связь наблюдается между следующими парами переменных: Х1 и Х2; Х1 и Х4. Но, как уже отмечалось в данной работе, при построении уравнения регрессии необходимо учитывать те переменные, которые имеют наибольшую связь с зависимой переменной Y2. Поэтому, выбирая между переменной Х1 и переменной Х2, приоритет будет отдаваться именно второму показателю, так как его связь с Y2 сильнее и равна 0,74. Таким образом, переменные Х4 и Х5 мы так же будет сравнивать с Х2. Значения, представленные в построенной корреляционной матрице, указывают на то, что связь между переменными Х5 и Х2 является средней, поэтому оба этих показателя будут использоваться при дальнейшем построении уравнения регрессии. А вот переменную Х4 мы исключаем из дальнейшего корреляционно- регрессионного анализа, так как ее связь с Х2 является сильной, что говорит о наличии между ними мультиколлиниарности. Таким образом, подытоживая все выше сказанное, можно сделать вывод, что из пяти указанных показателей, для построения уравнения регрессии, будут использоваться Х2 и Х5. Сделанные выводы так же подтверждают построенные выше корреляционные поля.

Отобрав наиболее значимые показатели можно приступить к построению самого уравнения регрессии. Основываясь на расчетах, которые представлены в Приложении 2, получаем следующие уравнение регрессии: Y=24233,028+6,288Х1-2026,853Х2 .

Теперь проверим значимость каждого из параметров уравнения с помощью t-статистики. В ходе проведенных расчетов были получены следующие значения t-статистики:

1) Параметр «а» (97,247): t-статистика= 0,514;

2) Параметр «в1» (0,000917): t-статистика= 2,04996;

3) Параметр «в2» (- 3,042): t-статистика= -0,6497.

Сравниваем каждое из этих значений с tтабл, которое находим по таблице Стьюдента, представленной в Приложении 3. Как находится tтабл подробно описывалось в ходе корреляционно-регрессионного анализа Y1, но учитывая, что количество выборки и количество учитываемых объясняющих (независимых) переменных Х одинаково, можно сразу сказать, что tтабл= 2,262.

Таким образом получаем следующий результат:

1) Параметр «а» незначим, так как t-статистика= 0,514 меньше, чем tтабл= 2,262;

2) Параметр «в1» незначим, так как t-статистика= 2,04996 меньше, чем tтабл= 2,262;

3) Параметр «в2» незначим, так как t-статистика= -0,6497 (если брать по модулю) меньше, чем tтабл= 2,262.

Дополнением ко всем сделанным выводам является p-значение, которое позволяет сделать вывод касательного того, оказывают ли переменные уравнения регрессии достаточный эффект на получаемые в итоге результаты, учитывая при этом, что все они оказались незначимы для построенного уравнения. Для того, чтобы сделать какие-либо выводы, касательно данного вопроса, необходимо сравнить p-значение каждого параметра с уровнем значимости, который, в научном сообществе, принято брать равны 0,05, что уже отмечалось в данной работе. Таким образом получаем следующие результаты:

1) p-значение параметра «а» равно 0,6198, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем;

2) p-значение параметра «в1» равно 0,0706, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем;

3) p-значение параметра «в2» равно 0,5321, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем.

2. Далее переходим к Республике Татарстан

На основе данных, представленных в приложении 2 составим корреляционные матрицы:

Таблица 5

Матрица парных коэффициентов корреляции R для Y1:

-

Y1

x1

x2

x3

x4

x5

Y1

1

0.9294

0.9355

-0.3424

0.8641

-0.6208

x1

0.9294

1

0.9972

-0.3101

0.786

-0.5573

x2

0.9355

0.9972

1

-0.3056

0.7943

-0.5606

Продолжение таблицы 5

x3

-0.3424

-0.3101

-0.3056

1

-0.1461

0.4303

x4

0.8641

0.786

0.7943

-0.1461

1

-0.2536

x5

-0.6208

-0.5573

-0.5606

0.4303

-0.2536

1

Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле:

(1)

где m = 1 - количество факторов в уравнении регрессии.

(2)

По таблице Стьюдента находим T таблице.

T крит(n-m-1;α/2) = (10;0.025) = 2.228

Поскольку tнабл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X1) статистически – значим

Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле:

(3)

Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X2) статистически - значим

Рассчитаем наблюдаемые значения t-статистики для ryx3 по формуле:

(4)

Поскольку t набл < t крит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X3) статистически - не значим

Рассчитаем наблюдаемые значения t-статистики для ryx4 по формуле:

(5)

Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X4) статистически - значим

Рассчитаем наблюдаемые значения t-статистики для ryx5 по формуле:

(6)

Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X5) статистически – значим

Итак, по представленным матрица и по значением t-статистики мы видим, что многие независимые переменные отпадают, так X1, X2, X4 мультиколлиниарны друг с другом, а X3 и X5 статистически не значимы. Отсюда следует, что мы оставляем X2

Далее составим уравнения множественной регрессии.

В результате расчетов было получено уравнение множественной регрессии:

Y1 = 0,0093x + 18,569

Возможна экономическая интерпретация параметров модели: увеличение инвестиций на 1 ед.изм. приводит к увеличению числа предприятий в среднем на 0.0093 ед.изм.; если же инвестиций не поступит вообще, то Y будет равен 18,6

Таблица 6

Матрица парных коэффициентов корреляции R для Y2:

-

Y2

x1

x2

x3

x4

x5

Y2

1

0.9046

0.9202

-0.00977

0.8349

-0.4174

x1

0.9046

1

0.9972

-0.3101

0.786

-0.5573

x2

0.9202

0.9972

1

-0.3056

0.7943

-0.5606

x3

-0.00977

-0.3101

-0.3056

1

-0.1461

0.4303

x4

0.8349

0.786

0.7943

-0.1461

1

-0.2536

x5

-0.4174

-0.5573

-0.5606

0.4303

-0.2536

1

Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле:

(7)

где m = 1 - количество факторов в уравнении регрессии.

(8)

По таблице Стьюдента находим Tтабл

T крит(n-m-1;α/2) = (10;0.025) = 2.228

Поскольку tнабл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X1) статистически - значим

Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле:

(9)

Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X2) статистически - значим

Рассчитаем наблюдаемые значения t-статистики для ryx3 по формуле:

(10)

Поскольку t набл < t крит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X3) статистически - не значим

Рассчитаем наблюдаемые значения t-статистики для ryx4 по формуле:

(11)

Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X4) статистически - значим

Рассчитаем наблюдаемые значения t-статистики для ryx5 по формуле:

(12)

Поскольку t набл < t крит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции (X5) статистически - не значим

Итак, по представленным матрица и по значением t-статистики мы видим, что многие независимые переменные отпадают, так X1, X2, X4 мультиколлиниарны друг с другом, а X3 и X5 статистически не значимы. Отсюда следует, что мы оставляем X2

Далее составим уравнения множественной регрессии.

В результате расчетов было получено уравнение множественной регрессии:

Y2 = 2,8349x – 11696

Возможна экономическая интерпретация параметров модели: увеличение инвестиций на 1 ед.изм. приводит к увеличению числа предприятий в среднем на 2, 8349 ед.изм.; если же инвестиций не поступит вообще, то сальдированный финансовый результат будет отрицательным и составит 11696

3. Осуществим расчет коэффициентов корреляции между зависимыми и независимыми переменными для Калининградской области.

Берем первую зависимую переменную за период с 2005 по 2016 год (валовый региональный продукт на 10000 человек) и рассчитываем коэффициенты корреляции, а также строим корреляционные поля.

Так, на рис.11 представлено корреляционное поле пары Х1 и Y1

Рис.11 Корреляционное поле Х1Y1

Из данного рисунка можно видеть, что связь между Х1 и Y1 прямая, а коэффициент детерминации R2 показывает, что степень связи между валовым региональным продуктом Калининградской области и числом малых предприятий, составляет около 20% и является малой.

Ниже, на Рис.12, представлено корреляционное поле пары Х2 и Y1

Рис.12 Корреляционное поле пары Х2Y1

Обратив внимание на данный рисунок, можно сделать вывод, что связь между независимой переменой Х2 и зависимой переменной Y1, так же, как и в случае с парой Х1Y1, является прямой и степень связи маленькая – 19,9%, что показывает коэффициент детерминации R2.

Дальше обратим внимание на корреляционное поле следующей пары переменных, а именно Х3 и Y1, которое представлено на Рис. 13

Рис.13 Корреляционное поле пары X3Y1

Анализируя данное корреляционное поле, можно заметить, что связь между представленными переменными является обратной. А вот зависимость Y1 от переменной Х3 очень низкая, что опять же показывает коэффициент детерминации R2. Таким образом, уже сейчас можно предположить, что среднегодовой уровень инфляции слабо влияет на численность малых предприятий в Калининградской области и использовать данный показатель при построении уравнения регрессии не придется.

Еще одно корреляционное поле, а именно пары переменных Х4 и Y1, представлено на Рис. 14

Рис.14 Корреляционное поле пары X4Y1

Из данного рисунка видно, что связь между такими показателями, как «динамика курса валютной пары доллара\евро по отношению к российскому рублю» и «число малых предприятий», является прямой, что наглядно показывает построенная линия тренда. Но при этом, основываясь на значении коэффициента детерминации R2, зависимость переменной Y1 от Х4 так же является довольно низкой и составляет около 8%. Данный показатель почти не влияет на развитие МСП в регионе.

Последнее корреляционное поле, которое мы рассмотрим в рамках анализа переменной Y1, представлено на Рис. 15

Рис.15 Корреляционное поле пары X5Y1

Линия тренда, показанная на данном рисунке, показывает, что связь между переменными Х5(ставка рефинансирования ЦБ РФ) и Y1(число малых предприятий на 10000 человек) является прямой. Коэффициент детерминации R2, в свою очередь, указывает на то, что зависимость Y1 от переменной Х5 является малой и составляет 5%

Теперь, когда были представлены все корреляционные поля, показывающие связь между зависимой переменной Y1 и всеми независимыми переменными Х, необходимо построить корреляционную матрицу, которая позволит отобрать показатели, которые имеют наибольшую связь с зависимой переменной, что позволит построить уравнение регрессии, учитывая при этом наличие линейной зависимости (мультиколлинеарность) между независимыми переменными Х (таб.7)

Таблица 7

Корреляционная матрица

y

x1

x2

x3

x4

x5

y

1

x1

0,454336068

1

x2

0,446335062

0,832748595

1

x3

-0,300846073

-0,322707707

-0,270024065

1

x4

0,295632315

0,790242929

0,484186266

0,154874733

1

x5

0,229281761

-0,435474358

-0,319717981

0,346306168

-0,236996178

1

4. Калужская область.

Теперь последовательно построим корреляционные поля и уравнение регрессии для каждой из зависимых переменных. Первым делом представим корреляционные поля для Y1 в паре с каждой из независимых переменных. Так, на Рис. 16 представлено корреляционное поле пары Х1 и Y1.

Рис.16 Корреляционное поле пары Х1 и Y1

Из данного рисунка можно видеть, что связь между Х1 и Y1 прямая, а коэффициент детерминации R2 показывает, что степень этой связи, между Валовым региональным продуктом Калужской области и числом малых предприятий, составляет около 83,5 % и является сильной.

Ниже, на Рис. 17, представлено корреляционное поле пары Х2 и Y1.

Рис. 17 Корреляционное поле пары Х2 и Y1

Обратив внимание на данный рисунок, можно сделать вывод, что связь между независимой переменой Х2 и зависимой переменной Y1, так же, как и в случае с парой Х1Y1, является прямой. А степень этой связи также сильная, составляя около 95,3%, что показывает коэффициент детерминации R2.

Дальше обратим внимание на корреляционное поле следующей пары переменных, а именно Х3 и Y1, которое представлено на Рис. 18.

Рис. 18 Корреляционное поле Х3Y1

Анализируя данное корреляционное поле, можно заметить, что связь между представленными переменными является обратной. А вот зависимость Y1 от переменной Х3 очень низкая, что опять же показывает коэффициент детерминации R2. Таким образом, уже сейчас можно предположить, что среднегодовой уровень инфляции слабо влияет на численность малых предприятий в Калужской области, и использовать данный показатель при построении уравнения регрессии не придется.

Еще одно корреляционное поле, а именно пары переменных Х4 и Y1, представлено на Рис. 19.

Рис.19 Корреляционное поле пары переменных Х4 и Y1

Из данного рисунка отчетливо видно, что связь между такими показателями, как «динамика курса валютной пары доллара\евро по отношению к российскому рублю» и «число малых предприятий», является прямой, что наглядно показывает построенная линия тренда. Но при этом, основываясь на значении коэффициента детерминации R2, зависимость переменной Y1 от Х4 является средней и составляет около 41%.

Последнее корреляционное поле, которое мы рассмотрим в рамках анализа переменной Y1, представлено на Рис. 20.

Рис. 20 Корреляционное поле Х5Y1

Линия тренда, показанная на данном рисунке, показывает, что связь между переменными Х5 и Y1 является обратной. Коэффициент детерминации R2, в свою очередь, указывает на то, что зависимость Y1 от переменной Х5 является средней и составляет около 50,7%.

Теперь, когда были представлены все корреляционные поля, показывающие связь между зависимой переменной Y1 и всеми независимыми переменными Х, необходимо построить корреляционную матрицу, которая позволит отобрать показатели, которые имеют наибольшую связь с зависимой переменной, что позволит построить уравнение регрессии, учитывая при этом наличие линейной зависимости (мультиколлинеарность) между независимыми переменными Х.

Таким образом, в ходе проведенных расчетов и проделанного анализа, была построена следующая корреляционная матрица, которая представлена на Таблице 8.

Таблица 8

Корреляционная матрица

Итак, отобрав показатели, между которыми не наблюдается наличие мультиколлинеарности, и связь которых с Y1 является сильной или средней, можно построить уравнение регрессии. В ходе проведенных расчетов, которые представлены в Приложении 2, было построено следующие уравнение регрессии: Y= 6,9784+0,0103×2,8528

Т-статистика, или по-другому критерий Стьюдента, используют чтобы проверить значимость каждого параметра в построенном уравнение. В ходе проведения соответствующих расчетов, были получены следующие значения t-статистики для каждого из параметров уравнения:

1) Параметр «а» (6,9784): t-статистика=0,368;

2) Параметр «в1» (0,0103): t-статистика=11,465;

3) Параметр «в2» (2,8528): t-статистика=2,074

Для того, чтобы определить значимыми ли являются данные параметры, необходимо сравнить их с табличным значением t-статистики. Согласно эконометрической теории tтабл.= ta/2; n-m-1, где: a- это уровень значимости, который рассчитывается, как разность между 1 и доверительной вероятностью, которую, в научном сообществе принято брать равной 0,95, объясняя это тем, что существует 95% вероятность того, что полученные результаты были не случайны; n- это количество выборки; m-это количество учитываемых объясняющих (независимых) переменных Х. Таким образом, в данной работе tтабл= t0,025; 9. Согласно таблице «Распределение Стьюдента», tтабл= 2,262. Согласно все той же эконометрической теории, если расчетная t-статистика больше, чем tтабл, то параметр уравнения значим. Учитывая все вышеизложенное, получаем следующие результаты:

1) Параметр «а» незначим, так как t-статистика= 0,368 меньше, чем tтабл= 2,262;

2) Параметр «в1» значим, так как t-статистика= 11,465 больше, чем tтабл= 2,262;

3) Параметр «в2» незначим, так как t-статистика= 2,074 меньше, чем tтабл= 2,262.

Дальше стоит пояснить, что представляет из себя p-значение. Данное значение позволяет сделать вывод касательного того, оказывают ли переменные уравнения регрессии достаточный эффект на получаемые в итоге результаты. Для этого p-значение необходимо сравнить с уровнем значимости, что покажет, будут ли результаты, полученные в ходе использования построенного уравнения, случайными или нет. В соответствии с эконометрической теорией, если p-значение меньше, чем уровень значимости, то можно констатировать, что связь между переменными и полученными результатами есть, то есть они не случайны. Как уже отмечалось выше, уровень значимости, в научном сообществе, обычно берется равным 0,05, так как доверительная вероятность равна 0,95. Таким образом, получаем следующие результаты:

1) p-значение параметра «а» равно 0,7213, что больше уровня значимости (0,05). Значит связь между данным параметром и результатами есть, то есть они не случайны; Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем;

2) p-значение параметра «в1» равно 0,000001 что меньшее уровня значимости (0,05). Значит связь между данным параметром и результатами есть, то есть они не случайны;

3) p-значение параметра «в2» равно 0,0679, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем.

Теперь, когда был проведен полный корреляционно-регрессионный анализ зависимой переменной Y1, можно приступать к аналогичному анализу переменной Y2. Первым делом рассмотрим корреляционные поля данной переменной с каждой из независимых переменных Х. На Рис. 21 представлено корреляционное поле пары переменной Х1 и Y2.

Рис. 21 Корреляционное поле Х1Y2

Итак, анализируя данный рисунок, можно сказать, что связь между переменными Х1 и Y2 является прямой, на что указывает линия тренда. В свою очередь, коэффициент детерминации R2 показывает, что зависимость переменной Y2 от переменной Х1 является средней и составляет около 43%.

Корреляционное поле следующей пары переменных, а именно Х2 и Y2, представлено на Рис. 22.

Рис. 22 Корреляционное поле Х2Y2

Линия тренда, которая изображена на данном рисунке, показывает, что связь между переменными Х2 и Y2 так же является прямой. При этом зависимость Y2 от переменной Х2 является средней, на что указывает коэффициент детерминации R2., и составляет около 50%.

Далее, на Рис. 23, представлено корреляционное поле еще одной пары переменных, а именно Х3 и Y2.

Рис. 23 Корреляционное поле Х3Y2

Линия тренда данного корреляционного поля показывает, что связь между двумя указанными переменными является обратной. Зависимость Y2 от переменной Х3 является очень низкой и составляет всего 0,1%, что отображает коэффициент детерминации R2, представленный на рисунке.

Четвертое корреляционное поле, относящееся к корреляционно-регрессионному анализу зависимой переменной Y2, представлено на Рис. 24.

Рис. 24 Корреляционное поле Х4Y2

Связь между указанными переменами так же является прямой, аналогично типам связи, представленными на предыдущих корреляционных полях. При этом зависимость Y2 от переменной Х4 довольно слабая и составляет около 19%, что отражает все тот же коэффициент детерминации R2.

Корреляционное поле последней пары переменных, а именно Х5 и Y2, представлены на Рис. 25.

Рис. 25 Корреляционное поле Х5Y2

Анализируя данный рисунок можно заметить, что связь между указанными переменными, представленной в виде линии тренда, является обратной, что отличает это корреляционное поле от предыдущих. Так же, зависимость переменной Y2 от переменной Х5 меньше 50%, но при этом не настолько низкая, и является 34,9%.

Теперь, когда были построены и представлены все корреляционные поля, необходимо отобрать наиболее значимые для уравнения регрессии независимые переменные Х. Как и при анализе Y1, для этого построим корреляционную матрицу, которая представлена в Таблице 9.

Таблица 9

Корреляционная матрица

Отобрав наиболее значимые показатели можно приступить к построению самого уравнения регрессии. Основываясь на расчетах, которые представлены в Приложении 2, получаем следующие уравнение регрессии: Y=5,556Х1×0,668Х2х659,686

Теперь проверим значимость каждого из параметров уравнения с помощью t-статистики. В ходе проведенных расчетов были получены следующие значения t-статистики:

1) Параметр «а» (-659,686): t-статистика= -0,3178

2) Параметр «в1» (5,556): t-статистика=0,1002;

3) Параметр «в2» (0,668): t-статистика= 2,4039.

Сравниваем каждое из этих значений с tтабл, которое находим по таблице Стьюдента. Как находится tтабл подробно описывалось в ходе корреляционно-регрессионного анализа Y1, но учитывая, что количество выборки и количество учитываемых объясняющих (независимых) переменных Х одинаково, можно сразу сказать, что tтабл= 2,262.

Таким образом получаем следующий результат:

1) Параметр «а» незначим, так как t-статистика= -0,3178 меньге, чем tтабл= 2,262;

2) Параметр «в1» незначим, так как t-статистика= 0,1002 меньше, чем tтабл= 2,262;

3) Параметр «в2» значим, так как t-статистика= 2,4039 больше, чем tтабл= 2,262.

Дополнением ко всем сделанным выводам является p-значение, которое позволяет сделать вывод касательного того, оказывают ли переменные уравнения регрессии достаточный эффект на получаемые в итоге результаты, учитывая при этом, что все они оказались незначимы для построенного уравнения. Для того, чтобы сделать какие-либо выводы, касательно данного вопроса, необходимо сравнить p-значение каждого параметра с уровнем значимости, который, в научном сообществе, принято брать равны 0,05, что уже отмечалось в данной работе. Таким образом получаем следующие результаты:

1) p-значение параметра «а» равно 0,7579, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем;

2) p-значение параметра «в1» равно 0,0396, что больше уровня значимости (0,05). Значит связь между данным параметром и результатами есть, то есть они не случайны;

3) p-значение параметра «в2» равно 0,9224, что больше уровня значимости (0,05). Значит констатировать, что результаты не являются «чистой» случайностью и данный параметр действительно влияет на них мы не можем.

5. Последний регион, который мы рассмотрим будет Тверская область.

Берем первую зависимую переменную за период с 2005 по 2016 год (валовый региональный продукт на 10000 человек) и рассчитываем коэффициенты корреляции, а также строим корреляционные поля.

Так, на рис.26 представлено корреляционное поле пары Х1 и Y1:

Рис.26 Корреляционное поле Х1Y1

Из данного рисунка можно видеть, что связь между Х1 и Y1 прямая, а коэффициент детерминации R2 показывает, что степень связи между валовым региональным продуктом Тверской области и числом малых предприятий, составляет около 90% и является сильной.

Ниже, на Рис. 27, представлено корреляционное поле пары Х2 и Y1

Рис. 27 Корреляционное поле Х2Y1

Обратив внимание на данный рисунок, можно сделать вывод, что связь между независимой переменой Х2 и зависимой переменной Y1, так же, как и в случае с парой Х1Y1, является прямой. А степень этой связи уже меньше, чем между Х1 и Y1, но все равно является довольно высокой, составляя около 64,9%, что показывает коэффициент детерминации R2.

Дальше обратим внимание на корреляционное поле следующей пары переменных, а именно Х3 и Y1, которое представлено на Рис. 28.

Рис. 28 Корреляционное поле Х3Y1

Зависимость Y1 от переменной Х3 очень низкая, что опять же показывает коэффициент детерминации R2, равный 23,3%.

Еще одно корреляционное поле, а именно пары переменных Х4 и Y1, представлено на Рис. 29.

Рис. 29 Корреляционное поле Х4Y1

Из данного рисунка отчетливо видно, что связь между такими показателями, как «динамика курса валютной пары доллара\евро по отношению к российскому рублю» и «число малых предприятий», является прямой, что наглядно показывает построенная линия тренда. Основываясь на значении коэффициента детерминации R2, зависимость переменной Y1 от Х4 является средней и составляет около 49,2%.

Последнее корреляционное поле, которое мы рассмотрим в рамках анализа переменной Y1, представлено на Рис. 30.

Рис. 30 Корреляционное поле Х4Y1

Линия тренда, показанная на данном рисунке, показывает, что связь между переменными Х5 и Y1 является обратной. Коэффициент детерминации R2, в свою очередь, указывает на то, что зависимость Y1 от переменной Х5 является маленькой и составляет около 22,1%.

Проанализируем связь между числом малых предприятий на 10000 человек населения региона (У1) и независимыми показателями.

Строим матрицу корреляций, чтобы установить тесноту связи между признаками. Табл. 10.

Таблица 10

 

Y1

x1

x2

x3

x4

x5

Y1

1

x1

0,953048599

1

x2

0,719322656

0,723139699

1

x3

0,451138396

0,312371433

0,368929876

1

x4

0,701944043

0,805101481

0,365088049

0,152539626

1

x5

0,470380478

0,494638365

0,75949661

0,345423472

0,236996178

1

Корреляционная матрица У1

Используя шкалу Челдока, при анализе построенной корреляционной матрицы, можно определить, какие из показателей имеют набольшую связь с зависимой переменной Y1. Согласно данной шкале связь бывает:

1) очень сильная- показатели от +/- 0,7 до +/-1;

2) средняя- показатели от +/-0,3 до +/-0,699;

3) очень слабая- от 0 до +/-0,299

Для уравнения регрессии необходимо отобрать показатели, которые имеют очень сильную и среднюю связь с переменной Y1. Таким образом, анализируя данную матрицу, видно, что сильная или средняя связь с Y1 наблюдается у следующих показателей: Х1, Х2, Х3, Х4 и Х5, то есть для уравнения регрессии мы берем все показатели.

Далее проводим анализ регрессии. Получаем уравнение регрессии:

y=16,29+0,0056х1-2,67х2+1,076х3

На основании уравнения регрессии мы делаем вывод, что на число малых предприятий в регионе влияет три фактора: ВРП, инфляция средняя и ставка рефинансирования ЦБ РФ.

В результате регрессионного анализа мы получили коэффициент детерминации (R-квадрат) равный 0,9359, который показывает долю вариации числа малых предприятий Тверской области под влиянием на него пяти факторов. Следовательно, около 93,59% вариации зависимой переменной учтено в модели, и обусловлено влиянием факторов, включенных в модель.

Множественный коэффициент корреляции (множественный R) равен 0,9674, что означает сильную связь между зависимой переменной и выбранными факторами.

Теперь, когда был проведен полный корреляционно-регрессионный анализ зависимой переменной Y1, можно приступить к переменной Y2. Первым делом рассмотрим корреляционные поля данной переменной с каждой из независимых переменных Х. На Рис. 31 представлено корреляционное поле пары переменной Х1 и Y2.

Рис.31 Корреляционное поле иY2.Х1

Итак, анализируя данный рисунок, можно сказать, что связь между переменными Х1 и Y2 является прямой, на что указывает линия тренда. В свою очередь, коэффициент детерминации R2 показывает, что зависимость переменной Y2 от переменной Х1 является средней и составляет около 40,8%.

Корреляционное поле следующей пары переменных, а именно Х2 и Y2, представлено на Рис. 32.

Рис.32 Корреляционное поле иY2.Х2

По данному графику мы видим, что связь между уровнем инфляции и сальдированным финансовым результатом является прямой и составляет 27%, что является средним показателем, на что указывает коэффициент детерминации.

Рассмотрим корреляционное поле зависимых Х3 и Y2 на рис.33.

Рис.33. Корреляционное поле иY2.Х3

Как и в предыдущем анализе независимой переменной, инфляция имеет обратную зависимость, что показывает нам линия тренда. Но при этом коэффициент детерминации является низким, всего лишь 3 %.

Четвертое корреляционное поле, относящееся к корреляционно-регрессионному анализу зависимой переменной Y2, представлено на Рис. 34.

Рис.34 Корреляционное поле Y2 и Х4

Связь между указанными переменами так же является прямой, аналогично типам связи, представленными на предыдущих корреляционных полях. При этом зависимость Y2 от переменной Х4 довольно слабая и составляет около 7%, что отражает все тот же коэффициент детерминации R2.

Корреляционное поле последней пары переменных, а именно Х5 и Y2, представлены на Рис. 35.

Рис. 35 Корреляционное поле Х5 и Y2

Анализируя данный рисунок можно заметить, что связь между указанными переменными, представленной в виде линии тренда, является обратной, что отличает это корреляционное поле от предыдущих. Так же, зависимость переменной Y2 от переменной Х5 низкая – 6%.

Проанализируем связь между сальдированный финансовым результатом малых предприятий (У2) и независимыми показателями.

Строим матрицу корреляций, чтобы установить тесноту связи между признаками Табл. 11.

Таблица 11

Корреляционная матрица У2

 

Y2

x1

x2

x3

x4

x5

Y2

1

x1

0,639366566

1

x2

0,508270676

0,04243822

1

x3

0,597407658

0,248999323

0,640102132

1

x4

0,271918884

0,45408334

0,365088049

0,161949084

1

x5

0,151259302

0,205538271

0,75949661

0,527125692

0,236996178

1

Из таблицы мы видим, что показатели Х1, Х2 и Х3 имеют умеренную либо очень сильную связь с зависимым показателем У2, поэтому мы будем использовать эти три показателя для дальнейшего анализа.

Далее проводим анализ регрессии. Получаем уравнение регрессии:

y=6158,036+0,01336x1+0,02657x2-365,596x3

На основании уравнения регрессии мы делаем вывод, что на сальдированный финансовый результат малых предприятий в Тверской области влияет только три фактора – ВРП, Инвестиции в основной капитал и Инфляция.

В результате регрессионного анализа мы получили коэффициент детерминации (R-квадрат) равный 0,6139 , который показывает долю вариации числа малых предприятий Тверской области под влиянием на него пяти факторов. Следовательно, около 61,3% вариации зависимой переменной учтено в модели, и обусловлено влиянием факторов, включенных в модель.

Множественный коэффициент корреляции (множественный R) равен 0,7835, что означает сильную связь между зависимой переменной и выбранными факторами. В современной России весьма остро стоит вопрос об эффективности поддержки государством субъектов малого. И это неудивительно: эти предприятия имеют неоспоримые преимущества по сравнению с крупным бизнесом, поскольку они, как правило, специализируются на одном направлении научных разработок, что не требует больших организационных затрат и инвестиций. Именно поэтому условиях кризиса государство играет не последнюю роль в формировании предпринимательской среды для малых предприятий и экономики России в целом. Но насколько эффективны предпринятые меры? Ответ на этот вопрос и является исследовательской задачей данной работы. Он позволит сделать аргументированные выводы о влиянии государства на субъекты малого предпринимательства, а также сформировать рекомендации для законодательных и регулирующих органов.

Субъект малого предпринимательства – это российская коммерческая компания или индивидуальный предприниматель, которые были созданы с целью получения прибыли. Помимо них, в эту категорию также входят крестьянские хозяйства, производственные и сельскохозяйственные кооперативы, хозяйственные партнерства.

Критерии, по которым компании относят к субъектам малого предпринимательства, установлены Федеральным законом от 29.06.2015 № 156-ФЗ. Закон гласит, что для отнесения в 2017 г. организации к субъектам малого предпринимательства, необходимо, чтобы выполнялись следующие условия:

  1. Размер выручки за 2015 год от реализации товара, работ или услуг (без учета НДС) не превышает 800 млн руб. [3];

  2. Среднесписочная численность работников за предыдущий год не превышает 100 человек;

  3. Доля сторонних организаций в уставном капитале не превышает 49%.

Субъекты малого предпринимательства законодательно находятся в выгодном положении по сравнению с другими предприятиями. Это обуславливается, в первую очередь, наличием льгот, установленных законодательством.

Таким образом, небольшие компании и ИП, попадающие под перечисленные критерии, пользуются следующими льготами, установленными государством:

  1. Надзорные каникулы. С 1 января 2016 г. по 31 декабря 2018 г. для субъектов малого предпринимательства запрещены неналоговые проверки [4]. Однако существует ряд требований: у компании не должно быть грубых нарушений в течение трех предыдущих лет.

  2. Отказ от лимита кассы. Субъекты малого предпринимательства имеют право не устанавливать лимит остатка наличных в кассе [5]. По закону отказаться от лимита можно в любой момент, однако на практике не все инспекторы готовы разрешить использовать эту льготу.

  3. Упрощенные учет и отчетность. Всем субъектам малого предпринимательства разрешено применять упрощённые способы бухгалтерского учета и сдавать отчетность в упрощенном виде (п. 4 ст. 6 ФЗ № 402). Однако и другим предприятиям можно переходить на УСН при выполнении необходимых условий.

  4. Льготы по региональным налогам. Местные власти вправе устанавливать льготы для субъектов малого предпринимательства. К примеру, по налогу на имущество с кадастровой стоимости (п. 2 ст. 372 НК РФ). Также региональные власти вправе устанавливать пониженные ставки для компаний на УСН.

  5. Преимущественное право покупки государственной и муниципальной недвижимости, находящейся в аренде у предприятий малого бизнеса. Эта норма прописана в ФЗ от 29.06.2015№ 158.

Об эффективности мер по поддержке субъектов малого предпринимательства можно судить по динамике их развития в нашей стране. Статистические данные свидетельствуют о том, что малое предпринимательство стало заметным явлением в экономике России. В целом за 2010-2016 гг. число малых предприятий в России выросло в 1,69 раза, на 1126 тыс. предприятий [6].

В заключении данного параграфа можно сделать выводы, что полученные в ходе корреляционно-регрессионного анализа уравнения статистически показывают текущее положение дел ,а стремление как известно есть всегда. Отобранные в качестве независимых переменных экономические показатели отражают дальнейшее изменение число малых предприятий в анализируемых регионах РФ и их сальдированный финансовый результат.