- •Оглавление
- •1. Сбор исходных данных
- •2. Выбор результативного признака и фактора аргумента, их математическое обозначение
- •3. Выбор формы связи (аппроксимация связей между параметрами)
- •4. Оценка силы связи, расчёт коэффициента корреляции
- •5. Расчет критерия надежности коэффициента корреляции
- •6. Расчет теоретической линии регрессии
- •7. Построение доверительной области уравнения регрессии
- •8. Определение средней ошибки аппроксимации
- •9. Значение квантилей t- распределения Стьюдента
- •10. Варианты для самостоятельной работы
- •Литература
4. Оценка силы связи, расчёт коэффициента корреляции
Для проверки значимости предполагаемой линейной формы связи (или приведенной к ней) подсчитывают коэффициент корреляции по формуле:
(7)
Таблица 2.
Данные для расчета коэффициента корреляции
Модель |
i |
Xi |
Yi |
Xi2 |
Yi2 |
XiYi |
Xi+Yi |
(Xi+Yi)² |
|
1 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
| |
3 |
|
|
|
|
|
|
| |
4 |
|
|
|
|
|
|
| |
5 |
|
|
|
|
|
|
| |
6 |
|
|
|
|
|
|
| |
7 |
|
|
|
|
|
|
| |
n |
∑ xi |
∑yi |
∑xi2 |
∑yi2 |
∑xiyi |
∑xi+yi |
∑ (xi+yi)2 | |
Сумма столбца |
|
|
|
|
|
|
|
|
Если связь между результативным признаком и фактором-аргументом может быть точно представлена прямой линией, то коэффициент корреляции r = ±1; знак «+» соответствует положительному наклону прямой, знак «-» отрицательному наклону. Если же связь между переменными вообще не существует, то r = 0.
Принято считать, что при r < 0,3 – слабая связь; r = 0,3 … 0,7 – средняя связь; r = 0,7 … 0,9 – сильная связь; r > 0,9 – весьма сильная связь.
При r > 0.9, можно переходить к расчету теоретической линии регрессии. При незначительной величине коэффициента корреляции необходимо изменить форму связи.
Вычисление коэффициента корреляции можно существенно облегчить, используя специально составленную форму (табл.2). Последние два столбца этой формы используют лишь для проверки вычислений по очевидной формуле:
(8)
5. Расчет критерия надежности коэффициента корреляции
Коэффициент корреляции r считается достоверным, если критерий надежности
(9)
где - средняя квадратическая ошибка коэффициента корреляции, для парной корреляции определяется по формуле:
. (10)
6. Расчет теоретической линии регрессии
Процесс нахождения теоретической линии регрессии называется выравниванием эмпирической линии регрессии. В основе выравнивания лежит метод наименьших квадратов.
Для этого искомое корреляционное уравнение приводится к виду:
(11)
Затем из данных наблюдений получают приближенные равенства:
(12)
Коэффициенты а0 и а1 определяют из условия, чтобы сумма квадратов разностей между левой и правой частями равенства (7) обращалась к минимуму:
(13)
Применяя обычный способ нахождения экстремума функции путём исчисления соответствующих частных производных и приравнивая их к нулю:
(14)
Преобразовав и решив данные уравнения, находим коэффициенты а0 и а1 для уравнения Ŷ = а0 + а1х:
. (15)
В знаменателе этих выражений стоит определитель системы:
, (17)
, (18)
. (19)
Подставляем полученные значения в формулы (2).