Практическое занятие 4.
Нелинейные модели парной регрессии и корреляции
Условие: По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи.
Таблица 1. Исходные данные, тыс.руб. на человека
-
Расходы на продукты питания, y , тыс. руб.
0,9
1,2
1,8
2,2
2,6
2,9
3,3
3,8
Доходы семьи, x , тыс. руб.
1,2
3,1
5,3
7,4
9,6
11,8
14,5
18,7
Задание: исследовать функции
1) линейную у = а + bх + ε
2) полулогарифмическую у = а + b*lnх + ε
3) зависимость у = а + b√х + ε
4) степенную у = а * хb * ε
Провести сравнительный анализ моделей и выбрать ту, которая наиболее хорошо аппроксимирует исходные данные.
Ход решения
1 Исследование линейной функции у = а + bх + ε
Для удобства дальнейших вычислений составляется таблица (ε=уi-ŷ).
Таблица 2
№ |
у |
х |
х*у |
х2 |
у2 |
ŷх |
у- ŷх |
(у- ŷх)2 |
Аi % |
1 |
0,9 |
1,2 |
|
|
|
|
|
|
|
2 |
1,2 |
3,1 |
|
|
|
|
|
|
|
3 |
1,8 |
5,3 |
|
|
|
|
|
|
|
4 |
2,2 |
7,4 |
|
|
|
|
|
|
|
5 |
2,6 |
9,6 |
|
|
|
|
|
|
|
6 |
2,9 |
11,8 |
|
|
|
|
|
|
|
7 |
3,3 |
14,5 |
|
|
|
|
|
|
|
8 |
3,8 |
18,7 |
|
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
|
Среднее значение |
|
|
|
|
|
|
|
|
|
σ |
|
|
|
|
|
|
|
|
|
σ2 |
|
|
|
|
|
|
|
|
|
1.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:
;
1.2 Строится уравнение регрессии, делаются выводы об изменении расходов на питание (у) при изменении дохода семьи (х) на 1000 руб.
1.3 Определяется показатель тесноты связи – линейным коэффициентом корреляции r xy :
Делаются выводы о тесноте связи.
1.4 Определяется коэффициент детерминации r2xy
D = r2x * 100%
Делаются выводы о степени дисперсии результата(у расходов на продукты питания) под влиянием дисперсии фактора (х - доходов семьи).
1.5 Оценивается качество уравнения регрессии в целом с помощью F –критерия Фишера:
Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл = 5,99)
Делаются выводы о статистической значимости уравнения в целом.
1.6 Определяется средняя ошибка аппроксимации (с помощью столбца 10 таблицы 2);
Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.
1.7 На одном графике изображаются исходные данные и линия регрессии.
2. Исследование полулогарифмической функции типа: у = а + b*lnх + ε
Для нахождения параметров регрессии делается замена: z = ln x и составляется вспомогательная таблица 3, (ε=уi-ŷ)
№ |
у |
х |
z |
z*у |
z2 |
у2 |
ŷх |
ε |
ε2 |
Аi % |
1 |
0,9 |
1,2 |
|
|
|
|
|
|
|
|
2 |
1,2 |
3,1 |
|
|
|
|
|
|
|
|
3 |
1,8 |
5,3 |
|
|
|
|
|
|
|
|
4 |
2,2 |
7,4 |
|
|
|
|
|
|
|
|
5 |
2,6 |
9,6 |
|
|
|
|
|
|
|
|
6 |
2,9 |
11,8 |
|
|
|
|
|
|
|
|
7 |
3,3 |
14,5 |
|
|
|
|
|
|
|
|
8 |
3,8 |
18,7 |
|
|
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
|
|
Среднее значение |
|
|
|
|
|
|
- |
- |
|
|
σ |
|
- |
|
- |
- |
- |
- |
- |
- |
- |
σ2 |
|
- |
|
- |
- |
- |
- |
- |
- |
- |
2.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:
;
2.2 Строится уравнение регрессии ŷz = а + bz. Заполняются столбцы 8-11 таблицы 3.
Индекс корреляции pxy находится по формуле
Делаются выводы о тесноте связи.
2.3 Определяется коэффициент детерминации r2xy
D = r2x * 100%
2.4 Оценивается качество уравнения регрессии в целом с помощью f –критерия Фишера:
Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл = 5,99)
Делаются выводы о статистической значимости уравнения в целом.
2.5 Определяется средняя ошибка аппроксимации
Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.
2.6 На одном графике изображаются исходные данные и линия регрессии.
3. Исследование функции с квадратным корнем типа: ŷх = a + b √ x
Для нахождения параметров регрессии ŷх = a + b √ x делается замена z = √x и составляется вспомогательная таблица 4 ( ε = yi − ŷ).
Таблица 4
№ |
у |
х |
z |
z*у |
z2 |
у2 |
ŷх |
ε |
ε2 |
Аi % |
1 |
0,9 |
1,2 |
|
|
|
|
|
|
|
|
2 |
1,2 |
3,1 |
|
|
|
|
|
|
|
|
3 |
1,8 |
5,3 |
|
|
|
|
|
|
|
|
4 |
2,2 |
7,4 |
|
|
|
|
|
|
|
|
5 |
2,6 |
9,6 |
|
|
|
|
|
|
|
|
6 |
2,9 |
11,8 |
|
|
|
|
|
|
|
|
7 |
3,3 |
14,5 |
|
|
|
|
|
|
|
|
8 |
3,8 |
18,7 |
|
|
|
|
|
|
|
|
Итого |
|
|
|
|
|
|
|
|
|
|
Среднее значение |
|
|
|
|
|
|
- |
- |
|
|
σ |
|
- |
|
- |
- |
- |
- |
- |
- |
- |
σ2 |
|
- |
|
- |
- |
- |
- |
- |
- |
- |
3.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:
;
3.2 Строится уравнение регрессии ŷz = а + bz. Заполняются столбцы 8-11 таблицы 4.
3.3 Индекс корреляции pxy находится по формуле
Делаются выводы о тесноте связи.
3.4 Определяется индекс детерминации p2xy
D = p2x * 100%