Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оставшиеся лекции все.doc
Скачиваний:
35
Добавлен:
02.05.2015
Размер:
498.18 Кб
Скачать

Лекция 10. Корреляционно-регрессионный анализ

Зависимости бывают функциональными или корреляционными.

Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменение средних величин.

Пример: Аналитическая группировка.

группы заводов по стоимости ОПФ

количество заводов

фонды (млн. руб.)

Товарная продукция (млн. шт.)

всего (∑)

всего (∑)

0,8-3,8

4

8,7

2,2

12,9

3,2

3,8-6,8

13

62,4

4,8

94

7,2

6,8-9,8

9

70,5

7,8

101,7

11,3

9,8-12,8

4

48,1

12

76,4

19,1

итого:

30

189,7

-

285

-

Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).

Задачи корреляционного анализа

1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);

2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).

3. Оценка тесноты связи между факторными и результативными признаками;

4. Оценка качества полученного уравнения (модели).

Способы выбора формы связи между факторными и результативными признаками

1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.

2. При помощи аналитической группировки.

3. Графическое изображение показателей (графический анализ).

4. Графическое изображение корреляционной таблицы.

Схема №7: “Классификация корреляционной зависимости”

парная - корреляционная зависимость между двумя признаками:

1. прямолинейная (линейная) отображается уравнением: y = a+bx

2. криволинейная:

2.1. параболическая: y = a+bx+cx2

2.2. гиперболическая: y = a+b ∙ 1/x

2.3. степенная: y = axb

многофакторная – корреляционная зависимость между несколькими признаками, отображается следующими уравнениями:

y = a+bx1+cx2+dx3

y = ax1b ∙ x2c ∙ x3d

Для составления парной корреляционно-регрессионной модели (= a+bx) нам необходимо определить коэффициенты регрессии (a, b, c,…). Для этого составим систему уравнений, выразив один коэффициент через другой, и решим её.

Правило составления алгоритма системы уравнений

1. Составим квадратичную матрицу из коэффициентов регрессии.

2. Слева, отступив на столбец и строку, сверху – на строку и столбец, запишем наши неизвестные.

3. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n – количество наблюдений.

x

y

x

a

a

b

b

a = …

b = …

Показатели корреляции

Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.

1. При прямолинейной парной зависимости теснота связи оценивается по парному коэффициенту корреляции: или .

Коэффициент корреляции имеет пределы: .

Если , то существует Если r=0, то связь отсутствует.

функциональная зависимость.

r=1 r=-1 r=0

Если r > 0, то связь прямая; если r < 0, то связь обратная.

Коэффициент корреляции характеризует корреляционную зависимость.

Оценка тесноты связи

Если: r < 0,1 – связь отсутствует;

0,1 ≤ r ≤ 0,3 – связь слабая;

0,3 ≤ r ≤ 0,5 – связь заметная;

0,5 ≤ r ≤ 0,7 – связь умеренная;

0,7 ≤ r ≤ 0,9 – связь высокая;

0,9 ≤ r ≤ 0,99 – связь весьма высокая.

2. При криволинейной зависимости теснота связи оценивается индексом корреляции:

.

3. Чтобы учесть колеблемость отдельных факторов и привести их в единую систему измерения (освободиться от различной размерности), рассчитываются β коэффициенты: .

Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).

4. Коэффициент эластичности показывает, на сколько процентов изменится результатирующий показатель, при изменении x на 1%: .

5. Коэффициент детерминации: ,

6. - эмпирическое корреляционное отношение.