- •Содержание
- •Предисловие
- •§ 1. Функциональная и корреляционная зависимости
- •§ 2. Определение статистической взаимосвязи
- •§ 3. Эмпирическая регрессия
- •§ 4. Дисперсионное и корреляционное отношения
- •§ 5. Аналитическая регрессия. Метод наименьших квадратов
- •§ 6. Линейная регрессия
- •§ 7. Ковариация и коэффициент корреляции
- •§ 8. Линейное уравнение регрессии в стандартных масштабах
- •§ 9. Некоторые нелинейные функции регрессии
- •§ 10. Множественная корреляция и регрессия
- •§ 11. Замена переменных в уравнениях регрессии
- •Приложения Приложение I. Теорема о разложении дисперсии
- •Приложение II. Теорема о среднем значении регрессии
- •Приложение III. Вторая теорема о разложении дисперсии
- •Приложение IV. Доказательство ограниченности ковариации
§ 9. Некоторые нелинейные функции регрессии
Несмотря на относительную распространенность линейных функций регрессии, во многих случаях они не могут быть использованы для описания связи между конкретными явлениями. Такая ситуация возникает в тех случаях, когда теория явления дает описание связи, отличное от линейного, или форма корреляционного поля показывает явно нелинейный характер зависимости. В некоторых случаях специально требуется выявить свойства взаимосвязи, не отражаемые линейным уравнением (например, выпуклость).
Рассмотрим некоторые наиболее распространенные случаи.
Корреляционное поле на рис. 9.1 свидетельствует о существенно нелинейном характере связи. По мере приближения значений x к нулю значения y возрастают очень сильно. В таких случаях могут быть использованы функции регрессии, обращающиеся в бесконечность при x = 0. Простейшая функция такого рода описывает гиперболу вида
Рис. 9.1
Применим к данному случаю систему нормальных уравнений (5.2), справедливую для любых функций регрессии. В нашем случае
частные производные равны
Отсюда получаем систему нормальных уравнений для гиперболы:
Если исследуемая зависимость характеризуется непропорциональным ростом результативного признака y по мере увеличения признака-фактора x (рис. 9.2), то выпуклость функции, не обнаруживаемая линейным уравнением связи, может быть выявлена при описании зависимости трехчленом второй степени:
Рис. 9.2
Функция регрессии содержит три параметра, следовательно, требуется составить систему из трех нормальных уравнений. Соответствующие частные производные равны:
Система нормальных уравнений принимает следующий вид:
Более сложные свойства зависимостей могут быть отражены полиномами более высоких степеней:
Для этого случая:
и система нормальных уравнений принимает вид:
Обратимся к примеру. В § 3 была рассмотрена зависимость продолжительности сборки узла от числа входящих в него деталей. Эмпирическая регрессия (рис. 3.1) показывает, что продолжительность сборки растет быстрее, чем число деталей в узле. Этому можно дать естественное объяснение. В узле, состоящем только из двух деталей А и Б, возможно лишь соединение АБ. Если в узел входят три детали А, Б и В, число попарных соединений равно трем: АБ, АВ и БВ. Для четырех деталей возможно уже шесть попарных соединений: АБ, АВ, АГ, БВ, БГ и ВГ. Для пяти деталей это число достигает уже 10 и т. д. Конечно, не все возможные попарные соединения реализуются в каждой сборке, но, во всяком случае, число соединений может расти быстрее, чем число деталей, входящих в узел. Для того, чтобы увидеть выпуклость книзу исследуемой зависимости, будем искать уравнение регрессии в виде полинома второй степени:
Для иллюстрации расчетов рассмотрим упрощенный пример: представлены данные всего по пяти узлам (в действительности определение трех параметров уравнения регрессии всего по пяти элементам совокупности должно привести к статистически неустойчивым результатам, так что рассматриваемый пример носит чисто учебный характер). Исходные данные и промежуточные расчеты сведены в таблицу 9.1.
Таблица 9.1. Расчет параметров полинома 2-й степени
Номер узла |
||||||||
1 |
3 |
9 |
9 |
27 |
81 |
27 |
81 |
8.8 |
2 |
4 |
10 |
16 |
64 |
256 |
40 |
160 |
10.0 |
3 |
5 |
12 |
25 |
125 |
625 |
60 |
300 |
12.3 |
4 |
6 |
17 |
36 |
216 |
1296 |
96 |
576 |
15.7 |
5 |
7 |
20 |
49 |
343 |
2401 |
140 |
980 |
20.2 |
Сумма |
25 |
67 |
135 |
775 |
4659 |
363 |
2097 |
67.0 |
Полученные значения сумм подставляем в систему нормальных уравнений:
Решением этой системы является набор параметров:
Уравнение регрессии имеет вид:
Рассчитанные по этому уравнению регрессионные значения приведены в таблице 9.1; сопоставление значений y и показывает их близкое соответствие.