Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Т.М. Сергеева Парная корреляция

.pdf
Скачиваний:
42
Добавлен:
19.08.2013
Размер:
246.09 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

“КУЗБАССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ”

Кафедра технологии строительного производства

ПАРНАЯ КОРРЕЛЯЦИЯ

Методические указания к практическим занятиям по курсу “Математические методы оптимального планирования” для студентов специальности 290300 “Промышленное и гражданское строительство” дневной формы обучения

Составители Т.М. Сергеева Н.Ю. Рудковская

Утверждены на заседании кафедры Протокол № 5 от 11.12.02 Рекомендованы к печати учебно-методической комиссией специальности 290300 Протокол № 18 от 11.12.02 Электронная копия находится в библиотеке главного корпуса ГУ КузГТУ

Кемерово 2003

1

ОБЩИЕ СВЕДЕНИЯ

Методы теории корреляции позволяют определять количественную зависимость между различными техническими, технологическими, экономическими, организационными и другими факторами, то есть строить экономико-статистические модели. При корреляционной зависимости изменение одной случайной величины вызывает изменение среднего значения другой. Корреляционные зависимости могут быть установлены при обработке большого количества наблюдений.

Практические занятия по парной корреляции являются составной частью системы обучения по курсу “Математические методы оптимального планирования” и помогают студентам научиться формулировать экономические и управленческие задачи. В работе рассматриваются парные связи между результирующим показателем и одним из влияющих на него факторов.

Цель работы – научить студентов математической постановке, алгоритмизации и технике решения задач анализа и планирования с применением метода парной корреляции.

Задача корреляционного анализа решается в следующей последовательности:

1.Устанавливается наличие связи между величинами.

2.Устанавливается форма линии регрессии.

3.Определяются параметры линии регрессии.

4.Определяются достоверность установленной зависимости и дос-

товерность отдельных параметров.

Корреляционным полем называют нанесенные на график в определенном масштабе точки, соответствующие одновременным значениям двух величин. Если на графике можно провести линию, вокруг которой концентрируются точки поля, то можно сделать вывод о наличии корреляции.

Теснота связи между величинами характеризуется коэффициентом корреляции r, который изменяется от 0 до 1. В случае если r = 0, линейной связи нет. Если r = 1, между двумя величинами существует

функциональная связь. При положительном r наблюдается прямая связь, т.е. с увеличением независимого переменного увеличивается зависимое. При отрицательном коэффициенте существует обратная связь, т.е. с увеличением независимого переменного уменьшается зависимое переменное.

2

r =

 

 

N xy −∑xy

 

 

,

(1)

N x

2

2

N y

2

2

 

 

( x )

 

( y )

 

где x и y – текущие значения наблюдаемых величин; N – число наблюдений.

Для численного выражения параметров линии регрессии применяется метод наименьших квадратов. Сущность метода состоит в том, что выбирается такая линия, при которой сумма квадратов разностей между фактическими наблюдениями зависимой переменной и расчетными значениями, полученными по регрессионной формуле, минимальна:

~

2

min,

(2)

S = ∑( y y )

 

где ~y – расчетное значение зависимого переменного по регрессионной

формуле.

Для нахождения параметров линии регрессии в выражение (2) вместо расчетного значения ~y подставляют правую часть формулы,

параметры которой следует найти. Допускают, что линия регрессии

~

= a + bx , тогда

 

 

прямая и y

 

 

 

S = ∑( y a bx )2 min .

(3)

Необходимо взять частные производные по a и

b от выражения

(3) и приравнять их к нулю:

 

 

 

S

 

 

 

 

 

 

a

= −2( y a bx ) =0

(4)

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

b

= −2( y a bx ) =0

 

 

 

 

 

 

 

Систему (4) преобразуем:

 

 

 

Na +bx = ∑ y

 

 

 

 

 

 

 

 

(5)

 

 

 

2

 

 

 

ax +bx

 

 

 

 

 

= ∑xy

 

После решения системы (5) относительно b и a получим формулы параметров линии регрессии

b =

N xy −∑xy

;

(6)

N x2 ( x )2

 

 

 

 

a = y bx ,

 

(7)

3

где x и y – средние значения коррелируемых величин.

В форму табл.1 заносят исходные данные для определения параметров прямой линии и коэффициента корреляции.

При линейной корреляции коэффициент корреляции r является не только критерием тесноты связи, но и критерием точности аппроксимации (подбора формулы, выражающей зависимость).

 

 

 

 

Таблица 1

 

 

 

 

 

y

x

xy

x2

y2

y1

x1

x1y1

x12

y12

y2

x2

x2y2

x22

y22

.

.

.

.

.

.

.

.

.

.

yn

xn

xnyn

xn2

yn2

Σy

Σx

Σxy

Σx2

Σy2

ПРИМЕР 1. Установить корреляционную зависимость между себестоимостью y (в тысячах рублей затрат на 1 тыс. руб. сметной стоимости строительства) и численностью рабочих x (на 1 тыс. руб. стоимости строительно-монтажных работ). Поле корреляции этой связи приведено на рис. 1. Исходные данные для определения линии регрессии приведены в табл. 2.

Таблица 2

Наблюдения

y

x

Наблюдения

y

x

Наблюдения

y

x

1

6,2

3,1

10

1,0

0,4

19

2,3

0,9

2

1,2

0,6

11

4,9

2,0

20

3,0

1,1

3

2,8

1,2

12

6,9

3,1

21

2,1

1,3

4

2,4

0,9

13

3,0

1,2

22

0,9

0,2

5

2,3

0,4

14

2,7

1,2

23

4,6

1,1

6

4,3

1,5

15

0,9

0,2

24

0,9

0,2

7

2,4

0,9

16

0,9

0,3

25

3,2

1,1

8

3,5

1,2

17

5,0

2,4

26

6,5

1,2

9

0,6

0,2

18

2,5

0,9

27

0,7

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

7

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

5

 

 

 

 

 

 

о с т ь

4

 

 

 

 

 

 

т о и м

3

 

 

 

 

 

 

С е б е с

 

 

 

 

 

 

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

0,5

1

1,5

2

2,5

3

 

 

 

Численность рабочих,чел..

 

 

Рис. 1. Поле корреляции (аппроксимация прямой линией)

Заполним табл. 3 по форме табл. 1 и произведем необходимые вычисления.

5

 

 

 

 

Таблица 3

 

 

 

 

 

y

x

xy

x2

y2

 

 

 

 

 

6,2

3,1

19,22

9,61

38,44

1,2

0,6

0,72

0,36

1,44

2,8

1,2

3,36

1,44

7,84

2,4

0,9

2,16

0,81

5,76

2,3

0,4

0,92

0,16

5,29

4,3

1,5

6,45

2,25

18,49

2,4

0,9

2,16

0,81

5,76

3,5

1,2

4,2

1,44

12,25

0,6

0,2

0,12

0,04

0,36

1,0

0,4

0,4

0,16

1,0

4,9

2,0

9,8

4,0

24,01

6,9

3,1

21,39

9,61

47,61

3,0

1,2

3,6

1,44

9,0

2,7

1,2

3,24

1,44

7,29

0,9

0,2

0,18

0,04

0,81

0,9

0,3

0,27

0,09

0,81

5,0

2,4

12,0

5,76

25,0

2,5

0,9

2,25

0,81

6,25

2,3

0,9

2,07

0,81

5,29

3,0

1,1

3,3

1,21

9,0

2,1

1,3

2,73

1,69

4,41

0,9

0,2

0,18

0,04

0,81

4,6

1,1

5,06

1,21

21,16

0,9

0,2

0,18

0,04

0,81

3,2

1,1

3,52

1,21

10,24

6,5

1,2

7,8

1,44

42,25

0,7

0,4

0,28

0,16

0,49

77,7

29,2

117,56

47,92

293,38

 

 

 

 

 

6

Используя данные из табл. 3, по формулам (6) и (7) вычисляем

b =

27 117 ,56 29,2 77,7

= 2,05 ;

27 47,92 ( 29,2 )2

 

 

a = 2,88–2,05·1,08 = 0,666.

Уравнение связи между себестоимостью строительства и численностью рабочих имеет выражение

~y = 0,666+2,05 x. (8)

Коэффициент корреляции между этими показателями определяем по формуле (1):

r =

27 117,56 29,2 77,7

= 0,99.

27 47,92 ( 29,2 )2 27 293,38 (77,7 )2

Корреляционная зависимость между себестоимостью и численностью рабочих в организации выражается в виде прямой линии, r приближается к единице, это означает, что зависимость между параметрами приближается к функциональной.

ПРИМЕР 2. Установить корреляционную зависимость между y (выработкой на одного рабочего в тысячах рублей) и x (коэффициентом текучести рабочих кадров). Результаты наблюдений приведены в табл. 4.

 

 

 

 

 

Таблица 4

Наблю-

y

x

Наблю-

y

x

дение

 

 

дение

 

 

1

10,3

0,14

10

4,0

0,3

2

10,5

0,13

11

4,9

0,36

3

9,2

0,18

12

5,0

0,34

4

8,2

0,12

13

4,0

0,37

5

7,2

0,18

14

4,8

0,4

6

5,9

0,24

15

4,0

0,42

7

5,2

0,22

16

2,2

0,38

8

4,8

0,24

17

4,1

0,5

9

4,3

0,29

18

2,0

0,48

 

 

 

 

 

 

7

Аналогично примеру 1 зададимся гипотезой, что между выработкой и текучестью рабочих имеется линейная зависимость. По методу наименьших квадратов определим параметры этой прямой и коэффициент корреляции r.

 

 

 

 

Таблица 5

 

 

 

 

 

y

x

xy

x2

y2

 

 

 

 

 

10,3

0,14

1,442

0,0196

106,09

10,5

0,13

1,365

0,0169

110,25

9,2

0,18

1,656

0,0324

84,64

8,2

0,12

0,984

0,0144

67,24

7,2

0,18

1,296

0,0324

51,84

5,9

0,24

1,416

0,0576

34,81

5,2

0,22

1,144

0,0484

27,04

4,8

0,24

1,151

0,0576

23,04

4,3

0,29

1,247

0,0841

18,49

4,0

0,30

1,20

0,090

16,00

4,9

0,36

1,764

0,1296

24,01

5,0

0,34

1,70

0,1156

25,0

4,0

0,37

1,48

0,1369

16,00

4,8

0,40

1,92

0,16

23,04

4,0

0,42

1,68

0,1764

16,00

2,2

0,38

0,836

0,1444

4,84

4,1

0,50

2,05

0,25

16,81

2,0

0,48

0,96

0,2304

4,00

∑100,6

∑5,29

∑29,098

∑1,7967

∑970,12

 

 

 

 

 

b =

18 29,098 5,29 100,6

= −2,716 ;

18 1,7267 5,292

 

 

a = 5,589–(–2,716)·0,294 = 6,388; y = 5,589;

8

x = 0,294.

Уравнение связи между выработкой рабочего и коэффициентом текучести кадров имеет выражение

~y = 6,388–2,716 x.

Коэффициент корреляции между этими показателями определяем по формуле (1):

r =

18 29,098 5,29 100,6

= −0,149 .

18 1,7967 5,292 18 970,12 100,6 2

Коэффициент корреляции представляет собой незначительную величину, и, следовательно, можно сомневаться в целесообразности линейной аппроксимации этой зависимости.

Попробуем эту зависимость аппроксимировать другой формулой, которая более точно соответствовала бы этим статистическим наблюдениям.

На рис. 2 приведено поле корреляции между показателем выработки и коэффициентом текучести рабочих кадров.

В ы р а б о т к а, т ы с. р у б.

1 1

10

9

8

7

6

5

4

3

2

1

0

0

0 , 1

0 , 2

0 , 3

0 , 4

0 , 5

0 , 6

 

К о э ф ф и ц и е н т

т е к у ч е с т и

 

Рис. 2. Поле корреляции

По форме облака рассеяния видно, что кроме прямой линии в центре тяготения точек можно провести кривую. Аппроксимируем эту кривую степенной зависимостью

 

9

 

 

 

~

= ax

b

.

(9)

y

 

Для определения параметров степенной зависимости воспользуемся процедурой метода наименьших квадратов, но предварительно произведем линеализацию (спрямление) кривой. Для этого прологарифмируем правую и левую части формулы (9), в результате получим выражение

ℓg

y = ℓg a + b ℓg x.

(10)

 

~

 

Параметры ℓg a и b найдем методом наименьших квадратов. Систему линейных уравнений (5) преобразуем, и решение получим по формулам

ℓg a =

А

 

;

 

 

 

Д

 

 

 

 

 

 

 

 

 

 

b =

B

,

(11)

где А = ∑ℓg

Д

 

 

 

y ∑(ℓg x)²–∑ℓg x ∑ℓg

y · ℓg x;

B = N ∑ℓg x · ℓg y –∑ℓg x∑ℓg;

Д= N ∑(ℓg x)² – (∑ℓg x)².

Врезультате вычислений получим ℓg a, для получения параметра a формулы степенной зависимости (9) это выражение следует потен-

цировать, в то время как

b получается в чистом виде.

Оценка точности аппроксимации криволинейной зависимости

производится при помощи корреляционного отношения

n =

~

2

.

(12)

1 ( y y )

 

 

( y y )2

 

 

Корреляционное отношение всегда

 

0 ≤ η ≤ 1, оно всегда положи-

тельно. Если η > r, то кривая точнее аппроксимирует зависимость, чем прямая; для прямой r= η.

Табл. 6 и 7 содержат форму записи исходных данных для определения степенной зависимости между параметрами и оценки точности аппроксимации.

Дополнительной оценкой точности аппроксимации, часто применяемой при оценке нелинейной корреляции, является средняя относительная ошибка аппроксимации ε, которая определяется по формуле

 

1

 

 

~

 

 

 

 

 

 

ε =

 

 

y y

·100.

(13)

N

y

 

 

 

 

 

 

Соседние файлы в предмете Строительство. Строительные конструкции