- •1. Причинность, регрессия, корреляция.
- •Корреляционно – регрессионный анализ. Линейная парная регрессия.
- •Оценка линейного коэффициента корреляции
- •Шкала Чеддока
- •Показатели работы некоторых сельскохозяйственных предприятий Тамбовской области (данные условные)
- •Расчетная таблица
- •Нелинейная парная корреляция.
- •Производство и себестоимость продукции на одном из заводов Тамбовской области в 2011 году
- •Расчетная таблица
- •4. Множественная регрессия.
- •Исходные данные
- •Расчётная таблица
- •5. Непараметрические методы анализа.
- •Вспомогательная таблица для расчёта коэффициента взаимной сопряжённости
- •Зависимость освоения «Статистики» от типа школы, которую закончили студенты
- •Расчётная таблица
- •Расчётная таблица
- •Расчетная таблица
4. Множественная регрессия.
Для измерения тесноты связи при множественной корреляционной зависимости, то есть при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.
Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.
Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле:
, где
rух - парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: 0 ≤ R ≤ 1.
Приближение R к единице свидетельствует о сильной зависимости между признаками.
Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками х1 и х2 при фиксированном значении других (k - 2) факторных признаков, то есть когда влияние х1 исключается, то есть оценивается связь между х1 и х2 в "чистом виде".
В случае зависимости у от двух факторных признаков х1 и х2 коэффициенты частной корреляции имеют вид:
,
где r – парные коэффициенты корреляции между указанными в индексе переменными.
В первом случае исключено влияние факторного признака х2, во втором – х1.
Пример 1.
Имеются данные по отдельным областям РФ о естественном убытии (приросте) населения человек за 1994 год в расчете на 1000 жителей (%), численности безработных к экономически активному населению и состояние условий труда работников в % к общей численности занятых на производстве (табл. 6).
На основании имеющихся данных определите влияние численности безработных (х1) и занятости работников в условиях, не отвечающим санитарно-гигиеническим нормам (х2) на естественную убыль населения (У) в областях Российской Федерации. Для этого определите:
а) параметры уравнения
Ух1х2 = а0 + а1х1 + а2х2, использовав метод наименьших квадратов;
б) коэффициенты парной корреляции
rх1у, rх2у, rх1у
г) коэффициент множественной корреляции
Rу (Х1Х2);
д) тесноту связи между результативным признаком и одним из факторных при постоянных значениях прочих факторов, т.е. определите значения rх1у (х2) и rх2у (х1).
Сделайте выводы.
Таблица 6
Исходные данные
№ п/п |
Административные области России |
Естественный прирост населения, чел. |
Численность безработных |
Занято в условиях, не отвечающих санитарным нормам, % |
1 |
Архангельская |
- 6.4 |
6.3 |
36,1 |
2 |
Вологодская |
- 8.4 |
4.0 |
32.1 |
3 |
Мурманская |
- 2.9 |
7.7 |
42.4 |
4 |
Ленинградская |
- 10.8 |
7.2 |
19.9 |
5 |
Новгородская |
- 10.9 |
5,8 |
11.7 |
6 |
Псковская |
- 12.6 |
7.6 |
16.5 |
7 |
Брянская |
- 6.7 |
4.3 |
23.8 |
8 |
Владимирская |
- 7.8 |
5.8 |
19,1 |
9 |
Ивановская |
- 8.9 |
8,5 |
29.4 |
10 |
Калужская |
- 7.8 |
4.6 |
18.6 |
11 |
Костромская |
- 7.8 |
7,3 |
20.2 |
12 |
Московская |
- 8.1 |
6.1 |
16.7 |
13 |
Орловская |
- 6.8 |
4.0 |
16.1 |
14 |
Рязанская |
- 9.0 |
4.9 |
16.3 |
15 |
Смоленская |
- 8.3 |
5.7 |
21.1 |
16 |
Тверская |
- 11,7 |
4.0 |
18.5 |
17 |
Тульская |
- 10,7 |
4.0 |
20.1 |
18 |
Ярослaвская |
9,8 |
5,2 |
26,0 |
19 |
Кировская |
- 6.1 |
6.2 |
16.5 |
20 |
Нижегородская |
- 8.1 |
4.9 |
20.2 |
21 |
Белгородская |
- 5.8 |
3.6 |
17.0 |
22 |
Воронежская |
- 8.1 |
4.2 |
16.5 |
23 |
Курская |
- 7,6 |
3,4 |
25,7 |
24 |
Липецкая |
- 6.8 |
4.8 |
29.0 |
25 |
Тамбовская |
- 8.6 |
5.4 |
15.3 |
26 |
Астраханская |
- 2.8 |
6.7 |
15.1 |
27 |
Волгоградская |
- 4.2 |
5.3 |
18.9 |
28 |
Пензенская |
- 6.1 |
5.6 |
15.5 |
29 |
Самарская |
- 4.8 |
4.2 |
23.0 |
30 |
Саратовская |
- 5.5 |
5.0 |
16.8 |
31 |
Ульяновская |
- 3.3 |
4.3 |
21.3 |
32 |
Ростовская |
- 5.5 |
5.0 |
24.6 |
Решение:
а) Для выявления зависимости между численностью безработных (х1), численностью занятых в условиях, не отвечающих санитарным нормам (х2) и естественным приростом (убылью) населения (У) в анализируемых областях построим уравнение зависимости Ух1х2 = а0 + а1х1 + а2х2, .
Вначале определим параметры уравнения а0 , а1, а2 , использовав метод наименьших квадратов.
Система нормальных уравнений для вычисления параметров уравнения а0 , а1, а2 выглядит следующим образом:
;
;
.
По данным табл. 7 рассчитаем необходимые для составления указанной системы суммы и подставим полученные расчёты в данную систему. Получим систему нормальных уравнений в виде:
;
;
.
Для нахождения параметров уравнения а0 , а1, а2 разделим первое уравнение на 32, второе – на 171,6, третье – на 680. Получим:
;
;
.
Из второго уравнения вычтем первое, а из третьего – второе, получим:
Разделим первое уравнение на 0,2496, второе – на (-0,178), получим:
Таблица 7