Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие ТОКН

.pdf
Скачиваний:
52
Добавлен:
20.02.2016
Размер:
1.15 Mб
Скачать

~

+...

 

 

~

 

~2

D[b1

~2

D[ y] = D[b0 +b1x1

+bn xn ] = D[b0 ] + x1

] +... + xn D[bn ] =

 

 

 

D y

 

~2

~2

 

 

 

=

 

 

(1

+ x

+... + xn ).

 

 

 

Nr

 

 

 

 

 

1

 

 

 

Здесь при выводе использовано свойство независимости оценок и соотно-

шение D[bi ] = DNry . Полученный результат можно интерпретировать следую-

щим образом: дисперсия отклика, предсказанного моделью, постоянна на по-

верхности сферы радиуса

~2

~2

n-мерного факторного простран-

ρ =1 + x1

+... + xn

ства, т.е. действительно не зависит от направления в пространстве. Это свойство часто бывает полезным, так как обычно заранее не известно, какая часть факторного пространства потребуется в дальнейшей работе.

1.3.5. Проверка адекватности модели Этап проверки на значимость заканчивается тем, что факторы, соответст-

вующие незначимым коэффициентам, исключаются из уравнения модели. Очевидно, что полученная таким образом модель может лишь с той или иной степенью точности описывать проведенный эксперимент. Для оценки степени близости модели и эксперимента – адекватности модели – используют статистические критерии. Суть их состоит в следующем. Оцененную некоторым образом степень рассогласования модели и эксперимента сравнивают с величиной возмущений в эксперименте. Если они имеют одинаковый порядок, то, очевидно, расхождение между моделью и экспериментом вызвано случайными причинами и модель считается адекватной. В противном случае необходимо признать, что это расхождение не случайно и модель плохо описывает эксперимент, т.е. неадекватна.

Формально проверка адекватности производится следующим образом. Степень рассогласования модели и эксперимента оценивается дисперсией аде-

кватности Sад2 :

 

2

 

r

N

 

 

 

~

~

 

2

 

 

S

 

=

 

( y

 

(b

+b x

+... +b x

 

))

 

,

(1.13)

 

 

 

 

 

 

ад

 

N L j=1

 

j

0

1 1 j

n

nj

 

 

 

 

где L – число членов в уравнении модели (при подсчете числа L учитываются свободный член b0 и те члены модели, которые остались в ней после провер-

ки на значимость).

Сравнивая выражения (1.13) и (1.8) и вспоминая основную идею метода наименьших квадратов, можно сделать вывод о том, что дисперсия адекватности имеет минимально возможное значение и никаким более удачным выбором оценок коэффициентов ее нельзя уменьшить. Выражение (1.13) можно существенно упростить, используя свойства матрицы планирования:

21

Sад2 =

r

N

(y

 

 

N L j=1

2

 

2

 

~2

~2

 

~

j

+ b0

+ b1x1 j +...

+ bn xnj

2( y jb0 + y jb1x1 j

 

 

 

 

 

 

 

 

~

 

~

+ b0b1x1 j +... + b0bn xnj +... + b1bn xnj +...) =

 

 

 

 

r

 

 

N

 

 

 

 

=

 

 

 

 

yi2

N (b2

+b2

+... +bn2 ) .

 

 

 

 

 

 

 

 

N L

 

0

1

 

 

 

 

 

 

 

j =1

 

 

 

+ + ~ +

... y jbn xnj )

(1.14)

Здесь должны учитываться оценки только тех членов, которые остались в модели после проверки на значимость. Возмущения в эксперименте оценива-

ются, как и выше, дисперсией воспроизводимости S2y . Далее составляется отношение F

S 2

F = ад

S 2y

и сравнивается с Fкр = F(α2 ,n1,n2 ) – табличным значением распределения Фишера с заданным уровнем значимости α2 . Здесь n1 = N L – число степеней свободы числителя, n2 – число степеней свободы знаменателя: n2 = N(r 1) , если S2y определяется по формуле (1.10), и n2 = p 1, если S2y определяется по формуле (1.11). Если F > Fкр, то модель неадекватна, при F Fкр модель при-

знается адекватной. Во втором случае правильнее говорить так: у нас нет достаточных оснований, чтобы считать модель неадекватной, или гипотеза об адекватности не противоречит опытным данным. Это следует из общих соображений по процедуре проверки гипотез и связано с тем, что, возможно, благодаря удачно проведенному эксперименту неадекватная модель была признана адекватной; если провести новый эксперимент, ситуация может измениться. Вероятность признать адекватную модель неадекватной не превосходит α2 .

Если модель адекватна, то ее можно использовать для самых разнообразных целей, например для интерполяции внутри области эксперимента. Экстраполяция за пределы указанной области будет не всегда оправданной.

1.3.6.Учет нелинейных членов

Втом случае, когда построенная модель неадекватна, можно попытаться

ееулучшить, введя в ее уравнение несколько нелинейных членов, которые учитывали бы взаимодействие факторов. Существенно при этом, что новые эксперименты проводить не нужно. Чтобы объяснить смысл взаимодействия, введем ряд новых терминов.

Эффектом фактора называется вклад фактора в величину отклика при переходе его от нижнего уровня к верхнему, остальные факторы при этом зафик-

22

сированы. Для линейной модели, как это легко проверить, он равен удвоенному значению соответствующего коэффициента.

Взаимодействие факторов возникает из-за того, что эффект одного из факторов зависит от уровня, на котором находится другой фактор. На рис. 1.5 пока-

заны два эксперимента 22 . В первом из них факторы взаимодействуют – эффект Э2 значимо (существенно) больше эффекта Э1 ; во втором взаимодействие от-

сутствует – эффект Э1незначимо (несущественно) отличен от эффекта Э2.

x2в

 

Э2

x2в

Э2

x2н

 

Э1

x2н

Э1

xн

xв

 

xн

xв

1

1

 

1

1

Рис. 1.5. Два эксперимента 22

В модели взаимодействие факторов учитывается, как выше сказано, введением нелинейных членов. Например, для плана 22 это будет член ~x1~x2 , и модель приобретает вид

y = β0 1~x1 2~x2 12~x1~x2 .

Возвращаясь к предыдущему примеру, можно сказать, что в первом случае коэффициент β12 значим, во втором он незначимо отличен от нуля.

Оценки коэффициентов при взаимодействиях рассчитываются, как и выше, методом наименьших квадратов, что дает

 

 

 

1 N

~ ~

bik =

 

 

y j xij xkj ,

 

 

 

 

 

N j =1

 

 

1

 

N

~ ~ ~

bikl =

 

 

y j xij xkj xlj ,

 

 

 

N j=1

 

i, k = 1,2,…,n, ik,

i, k, l = 1,2,…,n, ikl,

для парных и тройных взаимодействий соответственно.

23

Упростить процесс подсчета оценок можно путем введения в матрицу планирования новых столбцов, образуемых почленным перемножением столбцов

отдельных факторов. Для плана 23 матрица со столбцами взаимодействия приведена в табл. 1.5. Можно показать, что новая матрица планирования сохраняет все свойства старой: симметричность, нормированность, ортогональность, и по этой причине оценки коэффициентов получаются независимыми.

При подсчете оценок значения отклика берутся со знаками, которые соот-

ветствуют столбцам взаимодействия. Например, для плана 23 (табл. 1.5) оценка b23 подсчитывается следующим образом:

 

 

 

b =

1

(y y

2

y

3

+ y

4

+ y

5

y

6

y

7

+ y

).

 

 

 

 

 

23

8

 

1

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

Полная матрица плана 23

 

 

 

 

 

Таблица 1.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

 

 

~

 

 

~

 

 

 

~ ~

 

 

 

 

~ ~

 

 

 

~ ~

 

 

 

~ ~ ~

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x0

 

x1

 

 

x2

 

x3

 

 

 

x1x2

 

 

 

x1x3

 

 

 

x2 x3

 

 

 

x1x2 x3

 

 

1

+

 

+

 

 

+

 

 

+

 

 

 

+

 

 

 

 

+

 

 

 

 

+

 

 

 

+

 

y1

 

2

+

 

+

 

 

+

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

y2

 

3

+

 

+

 

 

 

 

+

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

y3

 

4

+

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

+

 

y4

 

5

+

 

 

 

+

 

 

+

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

y5

 

6

+

 

 

 

+

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

+

 

y6

 

7

+

 

 

 

 

 

+

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

+

 

y7

 

8

+

 

 

 

 

 

 

 

 

+

 

 

 

 

+

 

 

 

 

+

 

 

 

 

y8

 

Значимость коэффициентов новой модели проверяется подобно тому, как это делалось выше. Аналогично обстоит дело с проверкой адекватности, только

при подсчете дисперсии Sад2 необходимо учитывать вновь введенные члены:

 

2

 

 

r

N

~

~

2

 

S

ад

=

 

[ y j

(b0 +b1x1 j

+... +bn xnj +... +bml xmj xlj +...)]

 

=

N L

 

 

 

 

 

 

j =1

 

 

 

 

 

 

 

 

r

 

N

 

 

 

 

 

 

 

=

 

[ y2j

N(b02 +b12 +... +bn2 ) N(... +bml2 +...)].

 

 

 

 

 

N L

 

 

 

 

 

 

j =1

 

 

 

 

Напомним, что L означает число членов в новой модели.

Существует еще одна особенность при проверке адекватности. Если в модели учитывают все возможные взаимодействия, то адекватность проверить не удается из-за того, что дисперсия адекватности не определена, поскольку в

24

этом случае в выражении для дисперсии знаменатель N L = 0 и, кроме того, числитель также равен нулю. В этом случае говорят, что план насыщен, все степени свободы пошли на определение оценок коэффициентов и на проверку адекватности их не осталось.

Если введением нелинейных членов модель не удается сделать адекватной, то необходимо применить планирование другого типа. Дело в том, что неадекватность в этом случае объясняется наличием квадратичных нелинейностей ви-

~2

(реже – кубических), а план 2

n

не позволяет оценить коэффициенты при

да xi

 

этих нелинейностях. Это получается в силу того, что в матрице планирования

~2

столбец для члена xi совпадает со столбцом для переменной x0 и нельзя выяснить, за счет чего получена оценка b0 – за счет фактора x0 или каких-либо из

~2

членов вида bii xi . В этом случае говорят, что оценки смешаны, и символически записывают это следующим образом:

b0 0 + βii .

Подробнее о явлении смешивания см. в п. 1.4.1.

При необходимости можно оценить суммарный вклад квадратичных эффектов следующим образом. В центре плана ставится несколько опытов; среднее значение отклика при этом будет оценивать только один свободный член β0 , по-

скольку вклад линейных и квадратичных членов в этой точке равен нулю:

b0′ = y0 = 1p y0j .

Разность b0′ −b0 оценит тогда сумму квадратичных эффектов. Значимость

этой суммы, которую можно проверить так, как это описано в п. 1.3.4, может стать одной из причин, обусловливающих неадекватность линейной модели. Планы, позволяющие построить квадратичные модели, будут рассмотрены ниже.

1.3.7. Пример полного факторного эксперимента

Рассмотрим полный факторный эксперимент 23 (табл.1.6); пример искусственно синтезирован [2].

Рассчитаем оценку b0 :

b0 = 18 (68 + 72,5 + 75 + 64 + 71 + 69,5 +80,5 + 78,5) = 72,375.

Остальные оценки сведены в последнюю строку табл. 1.6. Линейная модель имеет следующий вид:

y = 72,375 +1,625~x1 3,875~x2 2,875~x3 .

25

Таблица 1.6

Матрица планирования и результаты эксперимента

 

~

 

~

 

~

 

~

 

~ ~

 

~ ~

 

~ ~

 

~ ~ ~

 

y

 

 

 

 

 

 

 

 

 

 

 

 

x0

 

x1

 

x2

 

x3

 

x1x2

 

x1x3

 

x2 x3

 

x1x2 x3

 

 

1

+

 

+

 

+

 

+

 

+

 

+

 

+

 

+

 

68

 

2

+

 

+

 

+

 

 

+

 

 

 

 

72,5

 

3

+

 

+

 

 

+

 

 

+

 

 

 

75

 

4

+

 

+

 

 

 

 

 

+

 

+

 

64

 

5

+

 

 

+

 

+

 

 

 

+

 

 

71

 

6

+

 

 

+

 

 

 

+

 

 

+

 

69,5

 

7

+

 

 

 

+

 

+

 

 

 

+

 

80,5

 

8

+

 

 

 

 

+

 

+

 

+

 

 

78,5

 

bi

72,375

 

1,625

 

– 3,875

 

– 2,875

 

0,125

 

0,375

 

0,375

 

– 0,125

 

 

 

По формуле (1.14) рассчитаем дисперсию адекватности:

Sад2 = 8 13 1[682 +72,52 +752 +642 +712 +69,52 +80,52 +78,52

8(72,3752 +1,6252 +3,8752 + 2,8752 )] = 0,625.

Дисперсия воспроизводимости определена по одиннадцати опытам, поставленным в центре плана: S y2 = 0,1. Рассчитываем отношение дисперсий:

F =

Sад2

=

0,625

= 6,25 .

S y2

0,1

 

 

 

Это отношение значимо на уровне значимости α = 0,01 при степенях сво-

боды n1 =8 4 = 4 , n2 =11 1 =10, поскольку 6,25 > F(0,01; 4; 10) = 5,99, т.е.

линейная модель неадекватна. Добавим в нее два нелинейных члена с наибольшими коэффициентами:

~

~

~

~ ~

~ ~

y = 72,375 +1,625x1

3,875x2

2,875x3

+ 0,375x1x3

+ 0,375x2 x3 .

Дисперсия адекватности в этом случае становится равной 0,125; отношение F=0,125/0,1=1,25 оказывается незначимым при том же уровне значимости и степенях свободы n1 =8 6 = 2 , n2 =10, поскольку 1,25<F(0,01; 2; 10)=7,56.

Проверка значимости коэффициентов модели на уровне 0,01 показывает, что коэффициенты b12 и b123 незначимы; например, для b12 получаем сле-

дующее: t =| b12 | N1/ 2 /(S y2 )1/ 2 =1,1, tкр = t(0,01;10) = 2,764 , т.е. t < tкр .

26

1.4.Дробный факторный эксперимент

1.4.1.Общие положения. План 231

Число опытов в полном факторном эксперименте может быть довольно велико, например, при n=10 оно составляет 1024. Ясно, что постановка такого эксперимента не очень реальна. Оказывается, однако, что число опытов можно зна-

чительно уменьшить. Рассмотрим это сначала на примере плана 22 (табл. 1.7).

Таблица 1.7

Полная матрица плана 22

 

~

 

~

 

~

 

~ ~

 

 

 

 

 

 

 

x0

 

x1

 

x2

 

x1x2

 

1

+

 

+

 

+

 

+

 

2

+

 

+

 

 

 

3

+

 

 

+

 

 

4

+

 

 

 

+

 

~ ~

Предположим, что взаимодействие x1x2 незначимо, и введем вместо него

~

в матрицу фактор x3 , сохранив тот же порядок чередования уровней факторов.

Получим так называемый план 231 , или полуреплику. Эксперимент теперь проводится согласно новому плану (табл. 1.8), который предусматривает проведение всего четырех опытов вместо восьми, как это должно было быть по

плану 23 . Таким образом, получен выигрыш в два раза.

Таблица 1.8

Матрица плана 231

 

~

 

~

 

~

 

~

 

y

 

 

 

 

 

 

 

 

x0

 

x1

 

x2

 

x3

 

 

1

+

 

+

 

+

 

+

 

y1

 

2

+

 

+

 

 

 

y2

 

3

+

 

 

+

 

 

y3

 

4

+

 

 

 

+

 

y4

 

Операцию замены взаимодействия на новый фактор можно символически представить равенством

~ ~

~

(1.15)

x1x2

= x3.

По сути дела, полученный план представляет собой одну половину матрицы 23 . Вторую можно получить, сделав замену:

~ ~

~

(1.16)

x1x2

= x3 .

27

Нетрудно увидеть, что ей соответствует план, представленный в табл. 1.9; вместе с предыдущим планом они образуют план 23 , в чем можно непосредст-

венно убедиться. Можно проверить также, что каждая половина плана 23 обладает всеми свойствами обычных планов: симметричностью, нормированностью, ортогональностью.

Таблица 1.9

Дополненная матрица плана 231

 

~

 

~

 

~

 

~

 

y

 

 

 

 

 

 

 

 

x0

 

x1

 

x2

 

x3

 

 

1

+

 

+

 

+

 

 

y5

 

2

+

 

+

 

 

+

 

y6

 

3

+

 

 

+

 

+

 

y7

 

4

+

 

 

 

 

y8

 

В принципе, полуреплику 231 можно получить из плана 23 , выбрав такие его строки, чтобы выполнялись обычные свойства; использование равенства (1.15) или (1.16) упрощает эту задачу. Модель в этом случае имеет обычный линейный вид:

~

~

~

;

y = β0 1x1

2 x2

3x3

оценки коэффициентов подсчитываются по формулам (1.9). Адекватность модели проверяется аналогично с тем же ограничением на случай насыщенных планов, который был рассмотрен в п. 1.3.6; это имеет место, например, для пла-

на 231 , в чем нетрудно убедиться.

Наряду с достоинством – сокращением числа опытов – дробный факторный эксперимент имеет один недостаток: в нем принципиально невозможно получить раздельные оценки всех коэффициентов, неизбежно возникают сме-

шивания, аналогичные описанным в п. 1.2.6. Например, для плана 231 имеется несколько смешиваний. Первое из них обусловлено самим принципом построения полуреплики и вытекает из соотношения (1.15):

b3 →β3 12 ,

остальные получаются при рассмотрении матрицы из табл. 1.8:

b1 →β1 23 ,

b2 →β2 + β13 ,

b0 →β0 123.

Для них можно написать соотношения, аналогичные равенству (1.15): x1 = x2 x3 , x2 = x1x3 , x0 = x1x2 x3 , которые называются генерирующими отно-

шениями; они непосредственно дают виды смешиваний.

28

Генерирующие соотношения можно получить довольно просто, не обращаясь всякий раз к матрице планирования. Для этого вводится так называемый определяющий контраст, представляющий собой равенство, в левой части которого стоит +1 (или –1), в правой – произведение заменяемого взаимодейст-

вия и нового фактора. Так, для реплики 231 (см. табл. 1.8) определяющий контраст имеет вид

1 = ~x1~x2~x3 ,

а для реплики из табл. 1.9

= −~ ~ ~

1 x1x2 x3 .

Генерирующие соотношения получаются из определяющего контраста путем умножения обеих его частей на фактор (или взаимодействие), который представляет собой интерес с точки зрения смешивания; при этом квадрат любого фактора заменяется единицей. Например, для реплики из табл. 1.9 имеем:

~

~2

x2 x3

~ ~

 

b1 →β1 + β23 ,

x1

= x1

= x2 x3 ,

~

~2

 

~ ~

,

b2 →β2 + β13 ,

x2

= x2 x1x3

= x1x3

~

~2

 

~ ~

,

b3 →β3 + β12 .

x3

= x3 x2 x1

= x2 x1

Последнее соотношение следует непосредственно из (1.16).

~ ~

Генерирующее соотношение для x0 получается подстановкой члена x0

вместо единицы в левую часть определяющего контраста. Для реплики из табл. 1.9 получим

~

~ ~ ~

,

b0 →β0 + β123.

x0

= x1x2 x3

Смешивания могут значительно исказить оценки, а именно сделать их смещенными. Этого, однако, не произойдет, если взаимодействия, с которыми

смешаны линейные оценки, будут незначимыми. Для реплик типа 231 в этом случае получим

b0 →β0 , b1 →β1, b2 →β2 , b3 →β3 ,

т.е. здесь смешивание отсутствует.

29

1.4.2. Дробные реплики на основе плана 23 На основе плана 22 возможны только две полуреплики с определяющими

~ ~ ~

 

~ ~ ~

3

гораздо богаче такими возмож-

контрастами 1 = x1x2 x3

и 1 = −x1x2 x3 . План 2

 

 

 

 

 

~ ~

~ ~

~ ~

ностями, так как он имеет четыре взаимодействия: три парных x1x2

, x1x3 ,

x2 x3

~ ~ ~

;

возможны, следовательно, восемь полуреплик. Не все

и одно тройное x1x2 x3

они равноценны. Так,

полуреплика 241

 

с определяющим

контрастом

~ ~ ~

 

 

 

1 = x1x2 x4 дает следующую систему смешиваний (рассматриваются только ли-

нейные эффекты):

 

 

 

b1 →β1 + β24 ,

b2 →β2 + β14 ,

b3 →β3 1234 ,

b4 →β4 + β12 .

Можно заметить, что три линейных эффекта из четырех смешаны с квадратичными. Эти квадратичные эффекты могут оказаться значимыми и вызвать смещение линейных оценок.

Полуреплика с контрастом 1 = ~x1~x2~x3~x4 имеет другую систему смешиваний:

b1 →β1 + β234 ,

b2 →β2 + β134 ,

b3 →β3 124 ,

b4 →β4 + β123 .

Эти смешивания предпочтительнее, так как линейные эффекты смешаны с тройными взаимодействиями, которые скорее окажутся незначимыми, чем парные взаимодействия.

Полуреплика с контрастом типа 1 = ~x1~x2~x4 называется планом с разрешающей способностью III (по наибольшему числу факторов в определяющем контрасте) и обозначается 24III1. Полуреплика с контрастом 1 = ~x1~x2~x3~x4 имеет

максимальную разрешающую способность, равную четырем, и поэтому называется главной полурепликой. Вторая главная полуреплика имеет контраст

1 = −~x1~x2~x3~x4 ; обе они обозначаются как 24IV1.

Из предыдущего рассмотрения становится очевидным, что планы с наибольшей разрешающей способностью обычно более предпочтительны в силу лучшей системы смешивания, которой они обладают.

Вторая особенность плана 23 состоит в том, что на его основе можно

строить реплики большей «дробности». Например, четвертьреплику

252 мож-

~

парному, а

~

– тройному взаимодейст-

но построить, приравнивая фактор x4

x5

вию. При этом возможны двенадцать вариантов, рассмотрим один из них:

~ ~ ~

~ ~ ~ ~

. Определяющие контрасты здесь 1

~ ~ ~

~ ~ ~

x4 = x1x2 ,

x5

= x1x2 x3

= x1x2 x4 , 1

= −x1x2 x4

~ ~ ~ ~

 

 

~ ~ ~

 

и 1 = x1x2 x3x5

. Перемножая их, получим еще один контраст 1 = x3x4 x5 , что дает

в итоге обобщающий определяющий контраст:

30