Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_УП.doc
Скачиваний:
125
Добавлен:
29.02.2016
Размер:
3.22 Mб
Скачать

8.4. Регрессионный анализ в изучении взаимосвязей социально-экономических явлений

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой, или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (у) от факторных. Регрессия может быть однофакторной (парной) и многофакторной (множественной).

По форме зависимости различают:

  1. линейную регрессию, которая выражается уравнением прямой(линейной функцией) вида

; (8.27)

  1. нелинейную регрессию, которая выражается уравнениями вида:

параболы

(8.28)

гиперболы

. (8.29)

Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная, а при обратной связи – гиперболическая.

Если результативный признак увеличивается в арифметической прогрессии, а факторный – значительно быстрее, то используется параболическая или степенная регрессия.

По направлению связи различают:

  1. прямую (положительную) регрессию, появляющуюся при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;

  2. обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Основной предпосылкой регрессионного анализа является то, что только результативный признак (у) подчиняется нормальному закону распределения, а факторные признакимогут иметь произвольный закон распределения. При этом заранее подразумевается наличие причинно-следственных связей между результативным (у) и факторными признаками. Число факторных признаков должно быть в 5–6 раз меньше объема изучаемой совокупности [1, 7–1].

8.5. Парная регрессия на основе метода наименьших квадратов (мнк)

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов (МНК), в основе которого лежит предположение о независимости наблюдений исследуемой совокупности.

Сущность метода МНК заключается в нахождении параметров модели (), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

. (8.30)

Для прямой зависимости:

.

Рассматривая Sв качестве функции параметрови проводя математические преобразования (дифференцирование), получаем

Откуда система нормальных уравнений для нахождения параметров линейной парной регрессии МНК имеет вид

где n– объем исследуемой совокупности (число единиц наблюдения).

Число уравнений в системе равно числу искомых параметров.

В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр(а в уравнении параболы и) – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Пример. Имеются следующие данные по 10-ти однородным предприятиям (см. табл. 8.4). Найти зависимость между электровооруженностью труда и продукцией на одного работника.

Решение. По данным табл. 8.4 зависимость между электровооруженностью труда и продукцией на одного работника выражается уравнением прямой:

,

где – выпуск готовой продукции;

– параметры уравнения регрессии;

– электровооруженность.

Таблица 8.4

Номер завода

Электровооруженность труда на 1 раб., Квт. ч.

х

Выпуск готовой продукции

на 1 раб., тыс. р.

у

ху

1

2

3

6

4

3,61

2

5

6

30

25

6,0

3

3

4

12

9

4,41

4

7

6

42

49

7,59

5

2

4

8

4

3,61

6

6

8

48

36

6,80

7

4

6

24

16

5,20

8

9

9

81

81

9,19

9

8

9

72

64

8,38

10

4

5

20

16

5,20

Итого

50,0

60,0

343

304

60

В среднем

5,0

6,0

34,3

30,4

6,0

Подставим в систему нормальных уравнений фактические данные из табл. 8.4:

Домножаем на 5 первое уравнение:

Параметры уравнения регрессии можно определить по формулам:

После определения параметров уравнения регрессии рассчитываем теоретическую линию регрессии путем подстановки значенийхв уравнение связи:

Если параметры уравнения связи определены правильно, то , т. е. 60=60.

Окончательная проверка правильности расчета параметров уравнения связи производится подстановкой ив систему уравнений.

Используя уравнение связи , можно определить теоретическое значениедля любой промежуточной точки.

Коэффициент регрессии уточняет связь междухиу.Он показывает на сколько единиц увеличится результативный признак при увеличении факторного признака на единицу.

Если значения признаков хиузаданы в определенном интервале (а – b), то для каждого интервала сначала определяют середину интервала, а затем строят уравнение регрессии между ними.

Если связь между признаками уихнелинейная и описываетсяуравнением параболы второго порядка, то

В данном случае задача сводится к определению неизвестных параметров: . Параметры находят по МНК, и система уравнений имеет вид:

Решая систему нормальных уравнений, определяют параметры параболы второго порядка.

Пример. В табл. 8.5 приведены данные о стаже рабочего и его выработке. Определить связь между стажем и выработкой рабочего.

Решение. Связь между стажем рабочего и выработкой криволинейная и выражается параболой второго порядка. Составляем систему нормальных уравнений по данным табл. 8.5.:

Домножим первое уравнение на 5 и вычтем первое уравнение из второго:

Домножим второе на 6,08 и вычтем его из третьего уравнения:

Таблица 8.5

№ п/п

Стаж, лет

х

Выработка, шт. в час

у

1

9

9

81

729

6 561

81

729

9,0

2

8

9

64

512

4 096

72

576

8,3

3

4

5

16

64

256

20

80

5,3

4

2

3

4

8

16

6

12

3,5

5

5

6

25

125

625

30

150

6,1

6

3

4

9

27

81

12

36

4,4

7

7

6

49

343

2 401

42

294

7,7

8

2

4

4

8

16

8

16

35

9

6

8

36

216

1 296

48

288

6,9

10

4

6

16

64

256

24

96

5,3

Итого

50

60

304

2 096

15 604

343

2 277

60

Уравнение Адомножим на 4,5876и вычтем из уравненияВ:

Подставим ив первое уравнение и вычислим параметр:

Уравнение связи тогда будет следующим:

.

Теоретическая линия регрессии:

и т. д.

Если результативный признак с увеличением факторного признака возрастает (или убывает) не бесконечно, а стремится к конечному пределу, то применяется уравнение гиперболы:

Чтобы определить параметры уравнения гиперболы методом наименьших квадратов, необходимо привести его к линейному виду. Для этого производится замена переменных получается система уравнений

Решая систему уравнений, определяются параметры уравнения гиперболы.

Уравнение степенной функции имеет следующий вид:

(8.31)

Степенная функция применяется в экономических исследованиях для характеристики слабо нелинейной связи между результативными и факторными признаками. Параметр имеет экономический смысл – этокоэффициент эластичности. Он показывает, что с увеличением признака фактора на 1 % результативный признак увеличивается на%.

Для определения параметров степенной функции методом наименьших квадратов степенную функцию необходимо привести к линейному виду путем логарифмирования. В результате логарифмирования получим уравнение вида

Заменим

Запишем уравнение

Строим систему нормальных уравнений:

Решая систему нормальных уравнений, определяем параметры иПереходя к первоначальным обозначениямопределяем параметр