540
.pdfгде Yj – вычисленное по уравнению (6.17) значение, соответствующее наблюдаемым значениям xij;
yj – наблюдаемое значение выходного параметра, соответствующее xij.
Подбирают коэффициенты регрессии по методу наименьших квадратов так, чтобы сумма квадратов отклонений (6.19) была минимальной. Подставляя в уравнение (6.19) уравнение (6.17), получают
n |
|
m |
|
2 |
|
|
|
|
|
||
F (a0 , a1, ..., am ) = ∑ a0 |
+∑ ai xi − yi . |
(6.20) |
|||
j =1 |
|
i =1 |
|
|
|
Поскольку условием существования экстремума функции (6.20) является равенство частных производных по каждой переменной (искомым коэффициентам) нулю, то для отыскания минимума функции F приравнивают нулю соответствующие частные производные:
|
|
|
∂F |
|
|
n |
|
|
m |
|
|
|||
|
|
|
|
|
|
|
= |
2∑ |
a |
0 +∑ ai xi − yi |
= 0, |
|||
|
|
∂a |
|
|
|
|||||||||
|
|
|
0 |
|
j =1 |
|
i =1 |
|
|
|||||
|
|
∂F |
|
|
|
|
n |
|
|
m |
|
|
||
|
|
|
|
|
|
= 2 |
∑ |
a0 |
+∑ ai xi − yi xi = 0, |
|||||
|
∂a1 |
|
|
|||||||||||
|
|
|
|
|
|
j =1 |
|
|
i =1 |
|
|
|||
.................................................... |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂F |
|
|
|
|
n |
|
|
m |
|
|
||
|
|
|
|
|
|
= 2∑ |
a0 |
+∑ ai xi − yi xi = 0. |
||||||
∂am |
|
|
||||||||||||
|
|
|
|
|
j =1 |
|
i=1 |
|
|
В итоге получают систему из m + 1 линейных уравнений, решив которую находят коэффициенты регрессии а0, аi (i = 1, ..., m). Для решения системы линейных уравнений обычно используют компьютеры и программное обеспечение.
При необходимости получения нелинейных уравнений регрессии, например в виде уравнения (6.18), расчет коэффициентов регрессии проводят аналогично.
Если анализируемая функция зависит от одного параметра, то уравнение линейной регрессии представляется в простом виде:
201
y = a +bx, |
(6.21) |
где a – свободный коэффициент (пересечение с осью у при
х = 0);
b – коэффициент – тангенс угла наклона прямой к оси х. Коэффициенты регрессии для уравнения (6.21) можно
непосредственно вычислить по формулам:
|
n |
n |
n |
|
|
|
|||
|
n∑ xi yi −∑ xi ∑ yi |
|
|
||||||
b = |
i =1 |
i=1 |
i =1 |
|
, |
(6.22) |
|||
n∑ x |
2 i − ∑ xi |
2 |
|||||||
|
|
|
|||||||
|
n |
n |
|
|
|
|
|
||
|
i =1 |
i=1 |
|
|
|
|
|||
|
|
n |
n |
|
|
|
|
|
|
|
|
∑ yi −b∑ xi |
|
|
|
||||
a = |
i =1 |
i=1 |
|
, |
|
(6.23) |
|||
|
n |
|
|
||||||
|
|
|
|
|
|
|
|
где n – число экспериментальных точек.
Статистический анализ уравнений регрессии заклю-
чается в проверке адекватности полученного уравнения
изначимости коэффициентов регрессии. Он дает возможность найти пределы измерения углового коэффициента
иотрезка на оси ординат для линии регрессии, а исследование адекватности позволяет оценить степень отклонения экспериментальных точек от расчетной линии.
Дисперсия адекватности уравнения регрессии Sàä2 ха-
рактеризует меру отклонения расчетных данных Yр, полученных по уравнению, от реальных экспериментальных результатов уi для i-й точки, в которой произведено измере-
ние. Значение Sàä2 находят по формуле
|
n |
(yi −Yp )2 |
|
Sàä2 = |
∑ |
|
|
i =1 |
|
, |
|
|
N −2 |
||
|
|
|
где (n – 2) = f – число степеней свободы.
Дисперсии коэффициентов уравнения регрессии (6.21) находят из выражений:
202
S 2 |
= |
|
|
nS 2a |
|
|
, |
(6.24) |
|
|
|
|
|
|
2 |
||||
b |
|
|
n∑ xi2 |
− ∑ xi |
|
|
|||
|
|
|
n |
n |
|
|
|
|
|
|
|
|
i =1 |
i=1 |
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
Sa2 = |
Sb2 ∑ xi2 |
|
|
|
|
||
|
|
|
i=1 |
|
|
|
(6.25) |
||
|
|
|
n |
|
|
|
|||
|
|
|
|
|
|
|
|
|
при числе степеней свободы f = n – 2.
После вычисления дисперсий вычисляют статистическую значимость коэффициентов регрессии. Эта проверка дает ответ на вопросы о том, проходит ли прямая, выраженная уравнением (6.21), через начало координат и отличается ли угол ее наклона от 45°. Критерием значимости для такой проверки является критерий Стьюдента.
Доверительные интервалы (границы) ∆а и ∆b для коэффициентов регрессии вычисляют по формулам:
∆а = ±tSa, |
(6.26) |
∆b = ±tSb. |
(6.27) |
Некоторые из найденных коэффициентов могут оказаться пренебрежимо малыми, незначимыми, их можно не учитывать. Факторы, перед которыми стоят незначимые коэффициенты, на анализируемую функцию. Коэффициенты регрессии ai значимы, если абсолютная величина коэффициента больше половинного значения ∆а/2 или ∆b/2, т.е. если выполняется условие
ai |
|
≥tSi , |
(6.28) |
|
где Si – оценка дисперсии каждого из коэффициентов регрессии;
t – значение критерия Стьюдента, определяемое по статистической таблице или вычисляемое на компьютере по уровню значимости α = 1 – Р и числу степеней свободы f.
203
Проверку адекватности уравнения регрессии проводят по F-критерию Фишера:
Fр = Sàä2 / S ó2 , |
(6.29) |
при числе степеней свободы числителя (n – 2), а знаменателя n(m – 1). Выборочная дисперсия S2y определяется по формуле
|
n m |
(yi j − y p )2 |
|
|
|
|
∑ ∑ |
|
|
||
S ó2 = |
i =1 j =1 |
|
, |
(6.30) |
|
n(m −1) |
|||||
|
|
|
где n – число серий измерений, i = 1, 2, …, n;
m – число параллельных измерений в каждой серии, j = 1, 2, …, m.
Если в каждой из серий число измерений mi разное, то для расчета S ó2 используют выражение
|
|
n |
(mi −1)S 2j |
|
|
|
|
∑ |
|
|
|
S 2 |
= |
i =1 |
|
. |
(6.31) |
|
n |
||||
ó |
|
|
|
|
|
|
|
|
∑ mi −n |
|
|
|
|
|
i=1 |
|
|
Для вычисления по этой формуле предварительно находят значения дисперсий Si2 в каждой из i серий.
Если значение Fр, определяемое по формуле (6.27), меньше табличного значения Fт, при избранном уровне значимости α = 1 – Р, то уравнение регрессии (6.21) адекватно описывает экспериментальные данные. Если значение Fр > Fт, то уравнение регрессии (6.21) неадекватно, следует предложить другой вид уравнения и исследовать новое уравнение.
6.3.Пример проведения регрессионного анализа
сиспользованием программного пакета Microsoft Excel
С помощью регрессионного анализа и программного пакета Microsoft Excel необходимо найти уравнение регрессии, максимальную степень превращения Х и оптимальные
204
условия проведения процесса (температура Т, концентрация С, соотношение реагентов n, расход V и давление газа P), соответствующие максимуму Х для экспериментов, результаты которых приведены в табл. 6.1.
Таблица 6.1
Исходные экспериментальные данные для регрессионного анализа
|
Темпе- |
Концен- |
Соотно- |
Расход |
Давле- |
Степень |
№ |
ратура |
трация |
шение |
газа, |
ние газа |
превра- |
п/п |
Т, °С |
С, % |
реагентов |
V, м3/ч |
P, МПа |
щения X, |
|
|
|
n |
|
|
доли |
1 |
350 |
10,0 |
1,00 |
1000 |
25,0 |
0,820 |
|
|
|
|
|
|
|
2 |
349 |
8,0 |
1,20 |
1100 |
24,0 |
0,810 |
|
|
|
|
|
|
|
3 |
360 |
14,0 |
1,10 |
1050 |
24,5 |
0,870 |
|
|
|
|
|
|
|
4 |
355 |
11,5 |
0,90 |
980 |
25,6 |
0,850 |
|
|
|
|
|
|
|
5 |
357 |
11,6 |
0,85 |
990 |
23,5 |
0,860 |
|
|
|
|
|
|
|
6 |
358 |
11,7 |
1,05 |
1020 |
25,1 |
0,865 |
|
|
|
|
|
|
|
7 |
351 |
10,2 |
1,21 |
1010 |
25,4 |
0,815 |
|
|
|
|
|
|
|
8 |
356 |
11,6 |
0,99 |
1070 |
24,6 |
0,855 |
В математический пакет анализа данных Microsoft Excel входит пакет регрессионного анализа, называемый «Регрессия», предназначенный для одновременного вычисления и записи в электронных таблицах следующих величин: результатов дисперсионного анализа, коэффициентов регрессии, стандартной погрешности вычисления Y, среднеквадратичных отклонений, числа наблюдений, стандартных погрешностей для коэффициентов. Использование такого пакета существенно ускоряет проведение расчетов и анализа.
Решение задачи состоит из следующих этапов:
1. Предварительные вычисления коэффициентов регрессии.
205
2.Анализ адекватности уравнения и значимости найденных коэффициентов уравнения. Отбраковка незначимых факторов.
3.Уточненные вычисления коэффициентов уравнения регрессии, вывод графиков подбора и остатков.
4.Анализ адекватности уточненного уравнения, значимости найденных коэффициентов уравнения и графиков подбора и остатков.
5.Оптимизация процесса по уточненному уравнению регрессии.
Предварительные вычисления коэффициентов рег-
рессии. Для предварительного вычисления коэффициентов уравнения регрессии копируют табл. 6.1 в электронную таблицу Microsoft Excel (в ячейку А1). Далее обращаются
кпакету анализа «Регрессия». Для этого в меню Microsoft Excel с помощью мыши выбирают «Сервис», в котором обращаются к команде «Анализ данных», в появившемся окне «Инструменты анализа» выбирают «Регрессия» и щелкают мышью ОК. После вхождения в пакет «Регрессия» появится диалоговое окно, содержащее следующие опции:
Входной интервал Y. Введите ссылку на диапазон анализируемых зависимых данных (F1:F9, столбец с данными степени превращения X). Диапазон должен состоять из одного столбца.
Входной интервал X. Введите ссылку на диапазон независимых данных, подлежащих анализу (B1:E9, столбцы аргументов Т, С, n, V, P). Максимальное число входных диапазонов равно 16.
Метки. Установите флажок, так как первая строка входного интервала содержит заголовки.
Уровень надежности. В соответствующее поле можно не вводить уровень надежности, поскольку уровень 95 % применяется по умолчанию.
Константа – ноль. Флажок не устанавливают. (Устанавливают флажок, только тогда, когда линия регрессии проходит через начало координат.)
206
Выходной диапазон. Можно вывести данные на лист
сисходной таблицей. Для этого введите ссылку на левую верхнюю ячейку выходного диапазона. Отведите, по крайней мере, семь столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.
Новый лист. Служит для вывода результатов расчета в отдельный лист. Установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Остатки; Стандартизированные остатки; График остатков; График подбора; График нормальной вероятности. Флажок против указанных опций не ставят на этапе предварительных расчетов, поскольку предварительный анализ проводят по итогам расчетов, приведенных в анализируемой таблице. При повторных уточненных расчетах эти опции могут оказаться полезными для того, чтобы вычислить остатки, построить диаграмму остатков для каждой независимой переменной, график.
После щелчка на ОК в отдельном листе появятся результаты предварительных расчетов в виде табл. 6.2.
Анализ адекватности уравнения и значимости найденных коэффициентов уравнения. Отбраковка незна-
чимых факторов. В верхней части табл. 6.2 приведены данные регрессионной статистики. Множественный R = = 0,998893 и стандартная ошибка – 0,002129, это свидетельствует о высокой степени совпадения вычисленных значений Х (по приведенному ниже уравнению регрессии)
сэкспериментальными значениями Х.
Оценка адекватности уравнения приведена в дисперсионном анализе. Высокая величина F = 180,4229 и низкое значение показателя Значимость F = 0,005521 (что меньше уровня значимости 0,05) указывают на адекватность уравнения регрессии.
207
Таблица 6.2
Выводимые программой Microsoft Excel результаты предварительных расчетов коэффициентов регрессии, регрессионной статистики и дисперсионного анализа
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
|
|
|
|||
|
Множественный R |
|
0,998893 |
|
|
|
|
|
|
|
|
|
|
|||
|
R-квадрат |
|
0,997788 |
|
|
|
|
|
|
|
|
|
|
|||
|
Нормированный R-квадрат |
0,992258 |
|
|
|
|
|
|
|
|
|
|
||||
|
Стандартная ошибка |
0,002129 |
|
|
|
|
|
|
|
|
|
|
||||
|
Наблюдения |
8 |
|
|
|
|
|
|
|
|
|
|
||||
208 |
Дисперсионный анализ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
df |
SS |
MS |
|
F |
|
Значимость F |
||||||
|
|
|
|
|
|
|
||||||||||
|
Регрессия |
5 |
|
0,004088 |
0,000818 |
|
180,4229 |
|
|
0,005521 |
|
|
||||
|
Остаток |
2 |
|
9,06E-06 |
4,53E-06 |
|
|
|
|
|
|
|
||||
|
Итого |
7 |
|
0,004097 |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
208
Окончание табл. 6.2
|
|
|
|
|
Коэффи- |
|
Стан- |
t-ста- |
|
|
P-значе- |
|
Нижние |
Верхние |
|||||
209 |
|
|
|
|
|
циенты |
|
|
дартная |
тистика |
|
|
|
|
ние |
|
|
95 % |
95 % |
|
|
|
|
|
|
|
|
ошибка |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y-пересечение |
|
|
–1,40707 |
0,219814 |
–6,40118 |
|
0,023546 |
|
–2,35285 |
–0,46129 |
||||||||
|
Т |
|
|
0,006185 |
|
0,000636 |
9,732943 |
|
0,010392 |
|
0,003451 |
0,00892 |
|||||||
|
C |
|
|
|
–0,00187 |
0,001448 |
–1,29021 |
|
0,326024 |
|
–0,0081 |
0,004361 |
|||||||
|
n |
|
|
|
–0,04395 |
0,009819 |
–4,4756 |
|
0,04647 |
|
–0,0862 |
–0,0017 |
|||||||
|
V |
|
|
|
5,81E-05 |
3,09E-05 |
1,880342 |
|
|
|
0,200808 |
|
–7,5E-05 |
0,000191 |
|||||
|
P |
|
|
0,002591 |
|
0,001484 |
1,746013 |
0,222924 |
–0,00379 |
0,008977 |
209
В нижней части табл. 6.2 выведены итоги расчета свободного коэффициента регрессии (Y-пересечение) и коэффициентов регрессии, стоящих перед аргументами Т, С, n, V и Р. С учетом результатов расчетов уравнение регрессии примет следующий вид:
Х = –1,40707 + 0,006185 · Т – 0,00187 · С – 0,04395 · n +
+ 5,81E-05 · V + 0,002591 · P. |
(6.32) |
Проверим значимость вычисленных коэффициентов регрессии. Значимость коэффициентов определяется по величине Р-значений, приведенных для каждого коэффициента в отдельном столбце. Коэффициенты уравнения значимы в том случае, если Р-значение меньше 0,05 (уровня значимости). Анализ величин Р-значений показывает, что условию значимости отвечают коэффициенты Y-пересечение и коэффициенты, стоящие перед аргументами Т и n. Исходя из этого в уравнении регрессии могут быть отброшены другие аргументы: С, V и Р, т.е. степень превращения Х для приведенных экспериментальных данных зависит только от температуры Т и соотношения реагентов n.
Уточненные вычисления коэффициентов уравнения регрессии, вывод графиков подбора и остатков. Для на-
хождения уточненного уравнения регрессии выполняют повторные вычисления, принимая в расчет в табл. 6.1 исходных экспериментальных данных только значимые столбцы аргументов Т и n и функцию Х (графы № 1, 3, 6).
Расчеты коэффициентов регрессии в программе Microsoft Excel выполняют аналогично вышеизложенным. Результаты расчетов приведены в табл. 6.3, 6.4 и на рис. 6.6, 6.7.
Анализ адекватности уточненного уравнения, значимости найденных коэффициентов уравнения, величин остатков и графиков подбора расчетных значений к экс-
периментальным Х. Анализ адекватности уравнения и значимости коэффициентов регрессии проводят аналогично вышеизложенному (см. табл. 6.3). Значение множественного
210