2.8.4. Алгоритм построения регрессионных моделей
на основе планирования экспериментов
Рассмотрим последовательность проведения экспериментов при построении математической модели экспериментально-статистическими методами.
1. На первом шаге необходимо выполнить содержательное описание исследуемого объекта, выделив два множества характеристик: зависимые и независимые. Зависимые характеристики можно рассматривать как составляющие вектора выходных координат объекта Y. Для построения математической модели в форме уравнения регрессии выбираем одну из составляющих этого вектора ( ). В создаваемой модели рассматривается в качестве выходного параметра ( ).
2. Используя выборку наблюдений за , выполняют проверку гипотезы о нормальном законе распределения для выходного параметра, а также допущения о стационарности объекта. Чтобы оценить характер эмпирического распределения можно использовать критерий Пирсона:
|
|
где K – число интервалов разбиения выборки N; – число значений случайной величины , попавших в j-й интервал; – частота появления значений случайной величины в j-м интервале.
Гипотезу о нормальном законе распределения можно принять, если
при , |
|
где – число оцениваемых параметров в законе распределения.
3. Проводится анализ множества независимых характеристик, в ходе которого выделяются характеристики линейно независимые, существенно влияющие на . В создаваемой модели эти характеристики будут рассматриваться в качестве факторов (Х).
4. Для каждого фактора определяется допустимый интервал, определяющий границы изменений . Нарушение этого интервала может привести к аварийным последствиям.
5. Выбирается базовая точка факторного пространства, которая совмещается с центром плана .
6. Для каждого фактора определяется шаг его варьирования Основное требование к шагу состоит в том, чтобы он не был меньше удвоенной среднеквадратичной ошибки фактора [9].
Иными словами, изменение фактора на величину должно значимо (не случайно) влиять на выходной параметр. При этом выполняется требование: Обычно шаг варьирования определяется на основе априорной информации и при необходимости корректируется.
7. Задается число уровней варьирования для каждого фактора. Наибольшее распространение получили планы с основанием два (при L=2).
Двухуровневый план эффективен (n>3), когда для проверки адекватности модели имеется достаточное число степеней свободы, т.е. имеется превышение числа опытов N над числом определяемых коэффициентов модели (n+1).
8. Рассчитываются верхние и нижние границы значений факторов для выбранного шага варьирования:
9. Составляется матрица планирования полного (или дробного) факторного эксперимента.
10. На основе матрицы планирования и с учетом вида физических параметров, изменяемых в ходе опытов, формируется список (S1), устанавливающий последовательность чередования опытов.
11. Выполняется весь объем экспериментальных исследований в соответствии с (S1). Регистрируется выборка значений выходного параметра (Y), по возможности выполняются параллельные замеры (Y). Пример в табл. 2.15.
12. Для оценки воспроизводимости (Y) рассчитываются выборочная дисперсия параллельных измерений (2.21) и критерий Кохрена (2.22) (пример в табл. 2.16).
Таблица 2.15
i
|
X1
|
X2
|
X3
|
y1
|
y2
|
y3
|
1 |
1 |
1 |
1 |
7,7 |
8,2 |
7,8 |
2 |
-1 |
1 |
1 |
2,1 |
2,6 |
2,2 |
3 |
1 |
-1 |
1 |
3,1 |
3,6 |
3,2 |
4 |
-1 |
-1 |
1 |
-0,1 |
0,4 |
0 |
5 |
1 |
1 |
-1 |
5 |
5,1 |
5,8 |
6 |
-1 |
1 |
-1 |
0,2 |
0,3 |
1 |
7 |
1 |
-1 |
-1 |
3,2 |
3,3 |
4 |
8 |
-1 |
-1 |
-1 |
0,8 |
0,9 |
1,6 |
Таблица 2.16
y1
|
y2
|
y3
|
y_sr
|
Дисперсия
|
7,7 |
8,2 |
7,8 |
8,4 |
0,07 |
2,1 |
2,6 |
2,2 |
4,4 |
0,07 |
3,1 |
3,6 |
3,2 |
6,4 |
0,07 |
-0,1 |
0,4 |
0 |
2,4 |
0,07 |
5 |
5,1 |
5,8 |
7,6 |
0,19 |
0,2 |
0,3 |
1 |
3,6 |
0,19 |
3,2 |
3,3 |
4 |
5,6 |
0,19 |
0,8 |
0,9 |
1,6 |
1,6 |
0,19 |
|
|
|
G_ras = |
0,046053 |
13. Если , то воспроизводимость выходного параметра хорошая, и выборку Y можно использовать для построения модели (перейти к шагу 14). Если , то выборочные дисперсии параллельных измерений Y не однородные и следует проанализировать причину такого результата. Необходимо выделить точки с большим отклонением от среднего по параллельным замерам и повторить эти опыты (перейти к шагу 11).
14. Выполняется расчет оценок дисперсии воспроизводимости (2.24), оценок линейных коэффициентов регрессии, средних квадратических отклонений коэффициентов регрессии и расчетных значений критерия Стьдента (пример на рис. 2.23).
15. Если , то коэффициент значимый, если , то случайно отличен от нуля, это незначимый коэффициент . После удаления всех незначимых коэффициентов переход к шагу 16.
16. Расчет критерия Фишера для линейного уравнения. Например,
Результаты расчетов, полученные в Excel, приведены на рис.2.24.
17. Если то перейти к шагу 18, иначе – к шагу 20.
18. Расчет коэффициента множественной корреляции.
Рис.2.23. Результаты расчетов на шаге 14, полученные в Excel
19. Если , то рекомендуется увеличить число факторов и перейти к шагу 4. Если , то можно принять гипотезу о математической модели в виде линейного уравнения регрессии . Модель в виде найденного линейного уравнения регрессии адекватна.
|
Рис.2.24. Результаты расчетов на шаге 16, полученные в Excel
|
20. Для повышения точности уравнения модели можно попытаться уменьшить шаг варьирования факторов
Если условие выполняется, то следует вернуться к шагу 8 и повторить расчет коэффициентов, характеризующих линейные эффекты.
Если уменьшить шаг варьирования факторов не удается, то необходимо дополнить уравнение эффектами взаимодействия.
21. Выполняется оценка коэффициентов регрессии ( ), характеризующих взаимодействия (2.79), средних квадратических отклонений коэффициентов ( ) и расчетных значений критерия Стьюдента ( ).
Если , то коэффициент значимый, если , то случайно отличен от нуля, это незначимый коэффициент ( ). После удаления всех незначимых коэффициентов переход к шагу 22.
22. Расчет критерия Фишера для уравнения вида
23. Если то перейти к шагу 24, иначе – к шагу 26.
24. Расчет коэффициента множественной корреляции.
25. Если , то рекомендуется увеличить число факторов и перейти к шагу 4. Если , то можно принять гипотезу о математической модели в виде нелинейного уравнения регрессии
.
Модель в виде найденного нелинейного уравнения регрессии адекватна.
26. Необходимо перейти к формированию плана второго порядка: ортогонального, центрального, композиционного плана (ОЦКП).
В качестве ядра плана принимается матрица планирования, созданная на шаге 9. Задаются параметры . Корректируется матрица плана.
27. Проводятся дополнительные опыты: в звездных точках и в центре плана. Регистрируется выборка значений выходного параметра (Y) в дополнительных опытах.
28. Так как выборка Y расширена новыми значениями, необходимо выполнить заново проверку воспроизводимости (2.21), (2.22).
29. Если , то воспроизводимость выходного параметра хорошая, и выборку Y можно использовать для построения модели (перейти к шагу 30). Если , то выборочные дисперсии параллельных измерений Y не однородные и следует проанализировать причину такого результата. Необходимо выделить точки с большим отклонением от среднего по параллельным замерам и повторить эти опыты (перейти к шагу 27).
30. Расчет оценок дисперсии воспроизводимости (2.24), оценок коэффициентов регрессии (2.92) - (2.94), средних квадратических отклонений коэффициентов и расчетных значений критерия Стьюдента.
31. Учитывая условие (2.90), из уравнения модели удаляются все незначимые коэффициенты.
32. Выполняется расчет критерия Фишера для квадратичного уравнения вида
33. Если то надо перейти к шагу 34, в противном случае следует переходить к другим формам нелинейных зависимостей (например, трансцендентному уравнению).
34. Расчет коэффициента множественной корреляции. Если , то рекомендуется увеличить число факторов и перейти к шагу 4. Если , то можно принять гипотезу о математической модели в виде квадратичного уравнения регрессии. Модель в виде найденного уравнения регрессии адекватна: