Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

540

.pdf
Скачиваний:
1
Добавлен:
15.11.2022
Размер:
2.35 Mб
Скачать

где Yj – вычисленное по уравнению (6.17) значение, соответствующее наблюдаемым значениям xij;

yj – наблюдаемое значение выходного параметра, соответствующее xij.

Подбирают коэффициенты регрессии по методу наименьших квадратов так, чтобы сумма квадратов отклонений (6.19) была минимальной. Подставляя в уравнение (6.19) уравнение (6.17), получают

n

 

m

 

2

 

 

 

 

 

F (a0 , a1, ..., am ) = a0

+ai xi yi .

(6.20)

j =1

 

i =1

 

 

 

Поскольку условием существования экстремума функции (6.20) является равенство частных производных по каждой переменной (искомым коэффициентам) нулю, то для отыскания минимума функции F приравнивают нулю соответствующие частные производные:

 

 

 

F

 

 

n

 

 

m

 

 

 

 

 

 

 

 

 

=

2

a

0 +ai xi yi

= 0,

 

 

a

 

 

 

 

 

 

0

 

j =1

 

i =1

 

 

 

 

F

 

 

 

 

n

 

 

m

 

 

 

 

 

 

 

 

= 2

a0

+ai xi yi xi = 0,

 

a1

 

 

 

 

 

 

 

 

j =1

 

 

i =1

 

 

....................................................

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

 

 

 

 

n

 

 

m

 

 

 

 

 

 

 

 

= 2

a0

+ai xi yi xi = 0.

am

 

 

 

 

 

 

 

j =1

 

i=1

 

 

В итоге получают систему из m + 1 линейных уравнений, решив которую находят коэффициенты регрессии а0, аi (i = 1, ..., m). Для решения системы линейных уравнений обычно используют компьютеры и программное обеспечение.

При необходимости получения нелинейных уравнений регрессии, например в виде уравнения (6.18), расчет коэффициентов регрессии проводят аналогично.

Если анализируемая функция зависит от одного параметра, то уравнение линейной регрессии представляется в простом виде:

201

y = a +bx,

(6.21)

где a – свободный коэффициент (пересечение с осью у при

х = 0);

b – коэффициент – тангенс угла наклона прямой к оси х. Коэффициенты регрессии для уравнения (6.21) можно

непосредственно вычислить по формулам:

 

n

n

n

 

 

 

 

nxi yi xi yi

 

 

b =

i =1

i=1

i =1

 

,

(6.22)

nx

2 i xi

2

 

 

 

 

n

n

 

 

 

 

 

 

i =1

i=1

 

 

 

 

 

 

n

n

 

 

 

 

 

 

 

yi bxi

 

 

 

a =

i =1

i=1

 

,

 

(6.23)

 

n

 

 

 

 

 

 

 

 

 

 

где n – число экспериментальных точек.

Статистический анализ уравнений регрессии заклю-

чается в проверке адекватности полученного уравнения

изначимости коэффициентов регрессии. Он дает возможность найти пределы измерения углового коэффициента

иотрезка на оси ординат для линии регрессии, а исследование адекватности позволяет оценить степень отклонения экспериментальных точек от расчетной линии.

Дисперсия адекватности уравнения регрессии Sàä2 ха-

рактеризует меру отклонения расчетных данных Yр, полученных по уравнению, от реальных экспериментальных результатов уi для i-й точки, в которой произведено измере-

ние. Значение Sàä2 находят по формуле

 

n

(yi Yp )2

 

Sàä2 =

 

i =1

 

,

 

N 2

 

 

 

где (n – 2) = f – число степеней свободы.

Дисперсии коэффициентов уравнения регрессии (6.21) находят из выражений:

202

S 2

=

 

 

nS 2a

 

 

,

(6.24)

 

 

 

 

 

2

b

 

 

nxi2

xi

 

 

 

 

 

n

n

 

 

 

 

 

 

 

i =1

i=1

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

Sa2 =

Sb2 xi2

 

 

 

 

 

 

 

i=1

 

 

 

(6.25)

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

при числе степеней свободы f = n – 2.

После вычисления дисперсий вычисляют статистическую значимость коэффициентов регрессии. Эта проверка дает ответ на вопросы о том, проходит ли прямая, выраженная уравнением (6.21), через начало координат и отличается ли угол ее наклона от 45°. Критерием значимости для такой проверки является критерий Стьюдента.

Доверительные интервалы (границы) а и b для коэффициентов регрессии вычисляют по формулам:

а = ±tSa,

(6.26)

b = ±tSb.

(6.27)

Некоторые из найденных коэффициентов могут оказаться пренебрежимо малыми, незначимыми, их можно не учитывать. Факторы, перед которыми стоят незначимые коэффициенты, на анализируемую функцию. Коэффициенты регрессии ai значимы, если абсолютная величина коэффициента больше половинного значения а/2 или b/2, т.е. если выполняется условие

ai

 

tSi ,

(6.28)

 

где Si – оценка дисперсии каждого из коэффициентов регрессии;

t – значение критерия Стьюдента, определяемое по статистической таблице или вычисляемое на компьютере по уровню значимости α = 1 – Р и числу степеней свободы f.

203

Проверку адекватности уравнения регрессии проводят по F-критерию Фишера:

Fр = Sàä2 / S ó2 ,

(6.29)

при числе степеней свободы числителя (n – 2), а знаменателя n(m – 1). Выборочная дисперсия S2y определяется по формуле

 

n m

(yi j y p )2

 

 

 

∑ ∑

 

 

S ó2 =

i =1 j =1

 

,

(6.30)

n(m 1)

 

 

 

где n – число серий измерений, i = 1, 2, …, n;

m – число параллельных измерений в каждой серии, j = 1, 2, …, m.

Если в каждой из серий число измерений mi разное, то для расчета S ó2 используют выражение

 

 

n

(mi 1)S 2j

 

 

 

 

 

 

S 2

=

i =1

 

.

(6.31)

 

n

ó

 

 

 

 

 

 

 

mi n

 

 

 

 

 

i=1

 

 

Для вычисления по этой формуле предварительно находят значения дисперсий Si2 в каждой из i серий.

Если значение Fр, определяемое по формуле (6.27), меньше табличного значения Fт, при избранном уровне значимости α = 1 – Р, то уравнение регрессии (6.21) адекватно описывает экспериментальные данные. Если значение Fр > Fт, то уравнение регрессии (6.21) неадекватно, следует предложить другой вид уравнения и исследовать новое уравнение.

6.3.Пример проведения регрессионного анализа

сиспользованием программного пакета Microsoft Excel

С помощью регрессионного анализа и программного пакета Microsoft Excel необходимо найти уравнение регрессии, максимальную степень превращения Х и оптимальные

204

условия проведения процесса (температура Т, концентрация С, соотношение реагентов n, расход V и давление газа P), соответствующие максимуму Х для экспериментов, результаты которых приведены в табл. 6.1.

Таблица 6.1

Исходные экспериментальные данные для регрессионного анализа

 

Темпе-

Концен-

Соотно-

Расход

Давле-

Степень

ратура

трация

шение

газа,

ние газа

превра-

п/п

Т, °С

С, %

реагентов

V, м3

P, МПа

щения X,

 

 

 

n

 

 

доли

1

350

10,0

1,00

1000

25,0

0,820

 

 

 

 

 

 

 

2

349

8,0

1,20

1100

24,0

0,810

 

 

 

 

 

 

 

3

360

14,0

1,10

1050

24,5

0,870

 

 

 

 

 

 

 

4

355

11,5

0,90

980

25,6

0,850

 

 

 

 

 

 

 

5

357

11,6

0,85

990

23,5

0,860

 

 

 

 

 

 

 

6

358

11,7

1,05

1020

25,1

0,865

 

 

 

 

 

 

 

7

351

10,2

1,21

1010

25,4

0,815

 

 

 

 

 

 

 

8

356

11,6

0,99

1070

24,6

0,855

В математический пакет анализа данных Microsoft Excel входит пакет регрессионного анализа, называемый «Регрессия», предназначенный для одновременного вычисления и записи в электронных таблицах следующих величин: результатов дисперсионного анализа, коэффициентов регрессии, стандартной погрешности вычисления Y, среднеквадратичных отклонений, числа наблюдений, стандартных погрешностей для коэффициентов. Использование такого пакета существенно ускоряет проведение расчетов и анализа.

Решение задачи состоит из следующих этапов:

1. Предварительные вычисления коэффициентов регрессии.

205

2.Анализ адекватности уравнения и значимости найденных коэффициентов уравнения. Отбраковка незначимых факторов.

3.Уточненные вычисления коэффициентов уравнения регрессии, вывод графиков подбора и остатков.

4.Анализ адекватности уточненного уравнения, значимости найденных коэффициентов уравнения и графиков подбора и остатков.

5.Оптимизация процесса по уточненному уравнению регрессии.

Предварительные вычисления коэффициентов рег-

рессии. Для предварительного вычисления коэффициентов уравнения регрессии копируют табл. 6.1 в электронную таблицу Microsoft Excel (в ячейку А1). Далее обращаются

кпакету анализа «Регрессия». Для этого в меню Microsoft Excel с помощью мыши выбирают «Сервис», в котором обращаются к команде «Анализ данных», в появившемся окне «Инструменты анализа» выбирают «Регрессия» и щелкают мышью ОК. После вхождения в пакет «Регрессия» появится диалоговое окно, содержащее следующие опции:

Входной интервал Y. Введите ссылку на диапазон анализируемых зависимых данных (F1:F9, столбец с данными степени превращения X). Диапазон должен состоять из одного столбца.

Входной интервал X. Введите ссылку на диапазон независимых данных, подлежащих анализу (B1:E9, столбцы аргументов Т, С, n, V, P). Максимальное число входных диапазонов равно 16.

Метки. Установите флажок, так как первая строка входного интервала содержит заголовки.

Уровень надежности. В соответствующее поле можно не вводить уровень надежности, поскольку уровень 95 % применяется по умолчанию.

Константа – ноль. Флажок не устанавливают. (Устанавливают флажок, только тогда, когда линия регрессии проходит через начало координат.)

206

Выходной диапазон. Можно вывести данные на лист

сисходной таблицей. Для этого введите ссылку на левую верхнюю ячейку выходного диапазона. Отведите, по крайней мере, семь столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.

Новый лист. Служит для вывода результатов расчета в отдельный лист. Установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.

Остатки; Стандартизированные остатки; График остатков; График подбора; График нормальной вероятности. Флажок против указанных опций не ставят на этапе предварительных расчетов, поскольку предварительный анализ проводят по итогам расчетов, приведенных в анализируемой таблице. При повторных уточненных расчетах эти опции могут оказаться полезными для того, чтобы вычислить остатки, построить диаграмму остатков для каждой независимой переменной, график.

После щелчка на ОК в отдельном листе появятся результаты предварительных расчетов в виде табл. 6.2.

Анализ адекватности уравнения и значимости найденных коэффициентов уравнения. Отбраковка незна-

чимых факторов. В верхней части табл. 6.2 приведены данные регрессионной статистики. Множественный R = = 0,998893 и стандартная ошибка – 0,002129, это свидетельствует о высокой степени совпадения вычисленных значений Х (по приведенному ниже уравнению регрессии)

сэкспериментальными значениями Х.

Оценка адекватности уравнения приведена в дисперсионном анализе. Высокая величина F = 180,4229 и низкое значение показателя Значимость F = 0,005521 (что меньше уровня значимости 0,05) указывают на адекватность уравнения регрессии.

207

Таблица 6.2

Выводимые программой Microsoft Excel результаты предварительных расчетов коэффициентов регрессии, регрессионной статистики и дисперсионного анализа

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

 

 

 

 

Множественный R

 

0,998893

 

 

 

 

 

 

 

 

 

 

 

R-квадрат

 

0,997788

 

 

 

 

 

 

 

 

 

 

 

Нормированный R-квадрат

0,992258

 

 

 

 

 

 

 

 

 

 

 

Стандартная ошибка

0,002129

 

 

 

 

 

 

 

 

 

 

 

Наблюдения

8

 

 

 

 

 

 

 

 

 

 

208

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

df

SS

MS

 

F

 

Значимость F

 

 

 

 

 

 

 

 

Регрессия

5

 

0,004088

0,000818

 

180,4229

 

 

0,005521

 

 

 

Остаток

2

 

9,06E-06

4,53E-06

 

 

 

 

 

 

 

 

Итого

7

 

0,004097

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

208

Окончание табл. 6.2

 

 

 

 

 

Коэффи-

 

Стан-

t-ста-

 

 

P-значе-

 

Нижние

Верхние

209

 

 

 

 

 

циенты

 

 

дартная

тистика

 

 

 

 

ние

 

 

95 %

95 %

 

 

 

 

 

 

 

 

ошибка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y-пересечение

 

 

–1,40707

0,219814

–6,40118

 

0,023546

 

–2,35285

–0,46129

 

Т

 

 

0,006185

 

0,000636

9,732943

 

0,010392

 

0,003451

0,00892

 

C

 

 

 

–0,00187

0,001448

–1,29021

 

0,326024

 

–0,0081

0,004361

 

n

 

 

 

–0,04395

0,009819

–4,4756

 

0,04647

 

–0,0862

–0,0017

 

V

 

 

 

5,81E-05

3,09E-05

1,880342

 

 

 

0,200808

 

–7,5E-05

0,000191

 

P

 

 

0,002591

 

0,001484

1,746013

0,222924

–0,00379

0,008977

209

В нижней части табл. 6.2 выведены итоги расчета свободного коэффициента регрессии (Y-пересечение) и коэффициентов регрессии, стоящих перед аргументами Т, С, n, V и Р. С учетом результатов расчетов уравнение регрессии примет следующий вид:

Х = –1,40707 + 0,006185 · Т – 0,00187 · С – 0,04395 · n +

+ 5,81E-05 · V + 0,002591 · P.

(6.32)

Проверим значимость вычисленных коэффициентов регрессии. Значимость коэффициентов определяется по величине Р-значений, приведенных для каждого коэффициента в отдельном столбце. Коэффициенты уравнения значимы в том случае, если Р-значение меньше 0,05 (уровня значимости). Анализ величин Р-значений показывает, что условию значимости отвечают коэффициенты Y-пересечение и коэффициенты, стоящие перед аргументами Т и n. Исходя из этого в уравнении регрессии могут быть отброшены другие аргументы: С, V и Р, т.е. степень превращения Х для приведенных экспериментальных данных зависит только от температуры Т и соотношения реагентов n.

Уточненные вычисления коэффициентов уравнения регрессии, вывод графиков подбора и остатков. Для на-

хождения уточненного уравнения регрессии выполняют повторные вычисления, принимая в расчет в табл. 6.1 исходных экспериментальных данных только значимые столбцы аргументов Т и n и функцию Х (графы № 1, 3, 6).

Расчеты коэффициентов регрессии в программе Microsoft Excel выполняют аналогично вышеизложенным. Результаты расчетов приведены в табл. 6.3, 6.4 и на рис. 6.6, 6.7.

Анализ адекватности уточненного уравнения, значимости найденных коэффициентов уравнения, величин остатков и графиков подбора расчетных значений к экс-

периментальным Х. Анализ адекватности уравнения и значимости коэффициентов регрессии проводят аналогично вышеизложенному (см. табл. 6.3). Значение множественного

210

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]