Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие ТОКН

.pdf
Скачиваний:
52
Добавлен:
20.02.2016
Размер:
1.15 Mб
Скачать

Любые измерения сопровождаются большими или меньшими погрешностями, поэтому и вес предметов определяется с погрешностью. Для оценки точности измерения весов предметов будем использовать дисперсию, предполагая, что измерения независимы, равноточны и каждое из них характеризуются дисперсией D. Тогда точность определения веса первого предмета можно оценить следующим образом:

D[VA] = D[V2 V1] = D[V2 ] + D[V2 ] = 2D.

Во втором подходе вначале взвешивается чашка со всеми тремя предметами, а уже затем каждый предмет в отдельности (табл. 1.2). Теперь вес предмета А определяется более сложным образом: VA = 0,5(W1 +W2 W3 W4 ) , его точ-

ность вычисляется по формуле

D[VA ] = 0,25(D[W1] + D[W2 ] + D[W3 ] + D[W4 ]) = D .

Видно, что точность (по сравнению с первым случаем) повысилась. Таким образом, не меняя числа опытов, а только изменив план эксперимента, удалось улучшить одну из его важных характеристик.

Таблица 1.2

План нового эксперимента

 

А

В

С

Вес

1

+

+

+

W1

2

+

W2

3

+

W3

4

+

W4

1.3. Полный факторный эксперимент

1.3.1. Общие положения. Матрица планирования и ее свойства

Рассмотрим следующую задачу. Имеется некоторый объект (или процесс), который можно описать моделью «черный ящик», имеющей n входов и единственный выход (рис. 1.3). Требуется построить модель этого объекта, т.е. найти зависимость, связывающую входные переменные x1, x2 ,..., xn и выходную y:

 

Неконтролируемые

 

 

факторы

x1

 

 

 

 

 

 

 

 

 

 

 

y

x2

. . .

 

 

xn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1.3. Модель «черный ящик»

11

y = f (x1, x2 ,..., xn ) .

Поскольку даже общий вид функции f, как правило, неизвестен, ее задают полиномом и определяют значения коэффициентов этого полинома.

Простейший полином – линейный, когда

y = α0 + α1x1 + α2 x2 +... + αn xn .

(1.3)

Для построения такой модели, точнее, для определения оценок коэффициентов α0 , α1, …, αn , будем использовать теорию планирования эксперимента.

В этой теории принята следующая терминология. Входные переменные называются факторами, значения, которые они принимают, – уровнями факторов, выходная переменная – откликом.

К факторам предъявляется ряд естественных требований, главные из них – управляемость, совместимость, независимость. Управляемость означает, что в некоторых пределах мы можем менять (варьировать) значение фактора по своему усмотрению. Факторы должны допускать варьирования независимо один от другого, при этом все комбинации их уровней должны быть осуществимыми и безопасными, т.е. факторы должны быть совместимыми.

Весьма важной задачей является выбор основного уровня и интервала варьирования каждого из факторов. В случае узкого интервала коэффициенты модели могут оказаться незначимыми, т.е. сравнимыми с уровнем возмущений в эксперименте; широкий же интервал может привести к неадекватности модели или излишним ее усложнениям. На выбор основного уровня влияют в значительной степени интервал варьирования и область определения факторов. Подробнее эти вопросы освещены в книге [2].

Число уровней варьирования факторов определяется целью эксперимента. Если нас удовлетворит линейная модель, то достаточно двух уровней для каждого фактора; в случае одного фактора это объясняется тем, что прямую линию можно провести через две точки. При этом, вообще говоря, некоторые точки оказываются лишними для построения модели, и эту добавочную информацию можно использовать для проверки адекватности модели. Для построения квадратичной модели двух уровней уже недостаточно, это же, очевидно, относится и к более сложным моделям.

Рассмотрим вначале (как более простые) планы эксперимента для построения линейной модели. В этом случае достаточно, как отмечено выше, чтобы каждый фактор принимал два значения, т.е. варьировать на двух уровнях –

верхнем ( xiв) и нижнем ( xiн); верхнему обычно соответствует большее значе-

ние фактора, нижнему – меньшее. Для построения модели и дальнейшего ее анализа оказывается удобным перейти к так называемым кодированным факторам ~xi , которые связаны с исходными следующим образом:

12

~

x

0,5(xв + x

н)

 

 

 

i

i

i

 

i = 1, 2, …, n.

 

xi =

 

 

 

 

,

(1.4)

 

0,5(xв xн)

 

 

 

i

i

 

 

 

 

Каждый из кодированных факторов принимает значения +1 (при x

= xв )

 

 

 

 

 

 

i

i

и –1 (при xi = xiн); чаще мы будем писать просто «+» и «–». Как будет видно из

дальнейшего, такой переход производится не случайно; в частности, он обеспечивает универсальность плана эксперимента, поскольку кодированные факторы безразмерны и не зависят от физического смысла исходных факторов.

Полным факторным экспериментом называется такой эксперимент, в

котором используются (реализуются) все возможные комбинации уровней факторов. В случае n факторов число опытов в таком эксперименте равно N = 2n ,

поэтому полный факторный эксперимент часто называют план 2n . Рассмотрим сначала подробно случай, когда n = 2; вместе с тем там, где

это можно, будем приводить формулы для произвольного n.

Пусть имеется два фактора x1 и x2 , каждый из которых варьируется на

двух уровнях (рис. 1.4, где xi0 = 0,5(xiв + xiн) . План проведения опытов и его ре-

зультаты заносятся в таблицу, называемую матрицей планирования (табл. 1.3), причем значения факторов заносятся в кодированном виде, значения отклика – в реальном масштабе.

x2н

~

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

x2в

 

~

 

 

Таблица 1.3

 

 

 

 

 

 

 

 

 

 

 

 

x1

Матрица плана 22

 

 

 

н

 

 

 

~

 

 

~

 

y

 

 

 

 

 

 

 

x2

 

 

 

x1

 

 

x2

 

 

 

 

 

1

+1

 

 

+1

 

y1

 

 

 

 

 

 

 

 

 

 

 

2

+1

 

 

–1

 

y2

 

x1н

x1в

x1

3

–1

 

 

+1

 

y3

 

4

–1

 

 

–1

 

y4

 

Рис. 1.4. План 22 в двухмерном факторном пространстве

Матрица планирования имеет ряд свойств, наиболее важными из которых для нас являются следующие три (свойства приводятся без доказательства, их

можно легко проверить по табл. 1.3, где приведена матрица плана 22 ):

13

симметричность – сумма всех элементов столбца каждого фактора равна нулю:

N ~

,

i = 1, 2, …, n;

(1.5)

xij = 0

j =1

нормированность – сумма квадратов всех элементов столбца каждого фактора одинакова и равна N:

N ~2

= N ,

i = 1, 2, …, n;

(1.6)

xij

j =1

ортогональность – сумма произведений одноименных элементов двух столбцов для разных факторов равна нулю:

N ~ ~

,

i, k = 1, 2, …, n, ik.

(1.7)

xij xkj = 0

j=1

~

Символом xij обозначено значение i-го фактора в j-м опыте; напомним, что оно равно +1 или –1. Свойства матрицы планирования будут использованы

вдальнейшем.

1.3.2.Построение модели

Линейная модель объекта в кодированных факторах принимает вид

y 0 1~x1 2~x2 ,

где β0 , β1, β2 – неизвестные подлежащие определению коэффициенты. Перей-

ти от этой модели к модели (1.3) можно с помощью формул перехода (1.4). Оценки коэффициентов β0 , β1, β2 найдем методом наименьших квадра-

тов, т.е. выберем их таким образом, чтобы минимизировать сумму квадратов разностей между экспериментальными значениями отклика и теми, которые предсказывает модель. Для этого составим искомую сумму квадратов

N

~

~

2

,

(1.8)

 

e = ( y j (β0 1x1 j 2 x2 j ))

 

j=1

найдем производные по параметрам β0 , β1, β2 и приравняем их к нулю (для

упрощения записей пределы суммирования в дальнейшем будем в некоторых случаях опускать):

14

e

 

 

N

~

~

 

 

 

 

 

= −2

( y j (β0

1x1 j 2x2 j )) = 0,

 

∂β0

 

 

 

j=1

 

 

 

 

e

 

 

N

~

~

~

 

 

 

 

= −2

( y j (β0

1x1 j 2x2 j ))x1 j = 0,

∂β1

 

 

j=1

 

 

 

 

e

 

 

N

~

~

~

 

 

 

 

= −2

( y j (β0

1x1 j 2x2 j ))x2 j

= 0.

∂β2

 

 

 

j=1

 

 

 

 

Решаем полученную систему уравнений, используя свойства матрицы планирования (1.5)-(1.7); подробные выкладки проведем для фактора ~x1 :

~

~

~

~

~

~2

~ ~

2( y j −β0 −β1x1 j −β2 x2 j )x1 j = −2( y j x1 j −β0 x1 j

−β1x1 j −β2 x2 j x1 j ) =

 

~

~

~2

~

~

 

= −2(y j x1 j −β0

x1 j −β1

x1 j

−β2 x2 j x1 j ) = 0.

 

Второе и четвертое слагаемые обращаются в нуль из-за свойств (1.5) и (1.7) соответственно, в результате чего полученное уравнение существенно упрощается и система распадается на отдельные независимые уравнения. Не будем выписывать их отдельно, а приведем итоговые уравнения для всех трех факторов:

 

 

y j Nβ0 = 0,

b0 =

 

1

 

y j ,

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~2

 

 

1

 

~

 

 

 

y j x1 j −β1x1 j

= 0,

b1 =

 

 

 

 

y j x1 j

,

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~2

 

 

1

~

 

 

 

y j x2 j

−β2 x2 j

= 0,

b2 =

 

 

y j x2 j ,

 

 

N

 

где b0, b1, b2 – оценки коэффициентов β0 , β1, β2

соответственно.

Для единообразия записи оценок в матрицу вводится столбец «фиктивной»

переменной

~

, которая принимает только одно значение +1 (или просто +)

x0

(табл. 1.4). Формула для всех оценок при этом приобретает следующий вид:

 

 

 

1 N

 

 

 

 

 

 

 

 

 

 

 

bi =

 

y j xij ,

i = 0, 1, …, n.

(1.9)

 

 

 

 

 

 

N j =1

 

 

 

 

 

 

 

 

 

15

Запишем эту формулу для плана 22 подробнее:

b0 = 14 (y1 + y2 + y3 + y4 ), b1 = 14 (y1 + y2 y3 y4 ),

b2 = 14 (y1 y2 + y3 y4 ).

Сравнивая эти выражения с матрицей табл. 1.4, можно сделать вывод о том, что в формулы для оценок коэффициентов значения отклика входят с теми знаками, которые расположены в столбце соответствующего фактора. Это замечание позволяет быстро находить оценки, используя матрицу планирования.

Формулы (1.9) справедливы для однократных опытов; в случае кратных, когда для каждой комбинации уровней факторов проводится r опытов, выражение для оценок будет иметь следующий вид:

 

1

N

~

 

bi =

 

y j x jl ,

i = 0,1,…,n,

 

 

N j =1

 

 

где y j – среднее значение отклика в j-м опыте:

y j = 1 r y jl , r l =1

y jl – значение отклика в j-м опыте при l-м его повторении, r – число кратных (повторных) опытов.

Таблица 1.4

Дополненная матрица плана 22

 

~

~

~

y

 

x0

x1

x2

1

+

+

+

y1

2

+

+

y2

3

+

+

y3

4

+

y4

Из-за наличия внешних неконтролируемых факторов и погрешностей измерительных средств полученные оценки являются случайными величинами; мож-

16

но показать, что они независимы благодаря свойствам (1.5)-(1.7) матрицы планирования. Докажем несколько меньшее, а именно то, что эти оценки некоррелированы; покажем предварительно, что они являются несмещенными. Значение отклика, полученное в j-м опыте, можно представить в следующем виде:

y j = β0 1~x1 j +... n ~xnj + ε j ,

где ε j – погрешность j-го опыта; предполагается, что опыты не имеют систе-

матической погрешности, т.е. M[ε j ] = 0.

Найдем математическое ожидание оценки bj , опираясь на свойства (1.5)-(1.7) и условие M[ε j ] = 0:

M[bi ]= M[

1

 

N

~

 

1 N ~

 

1 N ~

 

~

~

 

 

y j xij ] =

 

xijM[ y j ] =

 

 

xijM[β0 1x1 j +... n xnj + ε j ] =

 

 

 

 

 

N j=1

 

 

N j=1

 

N j=1

 

 

 

 

 

 

 

1

N

~

~ ~

~ ~

1

N ~2

 

 

 

=

 

(xijβ0 + β1xij x1 j +...

+ βn xij xnj ) =

 

βi xij

i.

 

 

 

N

 

 

 

 

N j=1

 

 

 

 

 

j=1

 

Отсюда видно, что bi – несмещенная оценка коэффициента βi . Подсчитаем корреляционный момент Kij :

 

1

N ~ ~

 

 

Kij = M[bib j ] M[bi ]M[b j ] = M

 

xil yl x jk yk

−βiβ j

 

N 2

l,k =1

 

 

 

 

 

 

 

 

 

 

 

1

 

 

N ~

 

 

 

~

 

 

 

 

 

 

=

 

 

xijM[ yl

]x jk M[ yk ] −βiβ j =

 

 

 

 

 

 

 

 

 

 

 

 

 

N 2 l,k =1

 

 

 

 

 

 

 

1

N ~

 

~

 

 

 

 

 

~

 

 

N ~

~

~

=

 

xij (β0

1x1l +... n xnl ) ×

 

x jk (β0

1x1k +... n xnk )

 

 

 

N 2 l =1

 

 

 

 

 

 

 

 

 

k =1

 

 

 

 

 

1

 

N ~2

 

 

N ~2

 

 

 

 

 

 

=

 

βi

x

jk

β j

x

jk

−βiβ j = βiβ j −βiβ j = 0.

 

 

 

N 2

 

 

 

 

 

l =1

 

k =1

 

 

 

=

−βiβ j =

При выводе учтено, что отдельные измерения независимы. Вывод проведен для однократных опытов, при кратных все будет аналогично.

Независимость оценок коэффициентов очень важна по следующей причине. При изучении малоисследованного процесса или объекта в описывающую

17

его модель на первых порах могут быть включены факторы, которые на самом деле совсем не влияют на отклик или влияют незначительно. При последующем анализе такие факторы будут удалены из модели, при этом оставшиеся факторы останутся в модели с ранее рассчитанными коэффициентами.

В отличие от этого коэффициенты, рассчитанные по формуле (1.1), оказываются зависимыми, что явно следует из выражения для βˆ . Более того, если окажется, что необходимо принять β = 0 (например, для закона Ома), то формула для оценки αˆ изменится:

αˆ = yi xi .

xi2

1.3.3. Дисперсия воспроизводимости Для анализа построенной модели нам потребуется знать точность экспе-

римента, которая оценивается так называемой дисперсией воспроизводимости

S y2 , рассчитываемой по формуле

S y2 =

1

N(r 1)

 

N r

 

∑ ∑( yij y j )2 .

(1.10)

j=1i=1

Эта дисперсия показывает, насколько хорошо воспроизводятся (повторяются) значения отклика в случае постановки нескольких опытов при неизменных значениях факторов, т.е. она характеризует величину возмущений в эксперименте, иначе – точность эксперимента. Под возмущениями понимается совокупность внешних неконтролируемых факторов и погрешностей измерительных средств.

Формулу (1.10) можно применять, однако, только в том случае, когда дисперсии воспроизводимости в отдельных точках плана – так называемые построчные дисперсии – не слишком сильно отличаются друг от друга, или, как говорят, дисперсии однородны. Подсчитываются эти дисперсии следующим образом:

 

1

r

 

S 2j =

( y jl y j )2 ,

j = 1,2,…,N.

 

 

r 1l =1

 

Проверку однородности дисперсий при одинаковой кратности опытов во всех точках плана можно провести с помощью критерия Кохрена. Для этого находят отношение наибольшей из дисперсий к сумме всех дисперсий:

S 2

G = Nmax .

S 2j

j =1

18

Если значение G не превосходит критического Gкр, определяемого по таб-

лице распределения Кохрена для выбранного уровня значимости, то гипотезу об однородности можно принять. В этом случае наилучшей оценкой дисперсии воспроизводимости будет среднее из всех дисперсий, т.е. выражение (1.10). Неоднородные дисперсии нельзя усреднять; чтобы воспользоваться статистическим анализом в этом случае, необходимо подыскать такое преобразование отклика, которое привело бы к однородным дисперсиям.

Если есть основания полагать, что дисперсии однородны, то можно не ста-

вить кратных опытов во

~всех~точках, ~а провести несколько экспериментов в цен-

тре плана – в точке, где

x1 = x2 =... = xn = 0, и по их результатам оценить диспер-

сию воспроизводимости. Конкретно, если y0

, y0

,..., y0 – результаты эксперимен-

 

1

2

p

тов в центре плана, то дисперсия воспроизводимости определяется выражением

 

1

p

 

S y2 =

( yi0 y0 )2

(1.11)

 

 

p 1i=1

 

с числом степеней свободы p – 1, где y0 = 1p yi0 . Это может дать выигрыш в

общем числе опытов, но в то же время – проигрыш в точности определения как дисперсии воспроизводимости, так и оценок коэффициентов. В конечном итоге это может сказаться на правильности заключения о значимости коэффициентов и адекватности модели, поэтому подобный прием не всегда оправдан.

1.3.4. Проверка значимости коэффициентов Следующий этап работы – проверка значимости коэффициентов модели.

Смысл ее состоит в том, чтобы выяснить, равны ли нулю некоторые коэффициенты модели, иными словами, проверить, все ли факторы существенно (по сравнению с уровнем возмущений) влияют на отклик. Для этого необходимо сравнить разность между оценкой исследуемого коэффициента и нулем или (что то же) модуль оценки с величиной среднеквадратичной ошибки определения этой оценки. Если они одного порядка, то факт отличия оценки от нуля можно объяснить имеющимися возмущениями, т.е. случайными причинами; в этом случае проверяемый коэффициент считается незначимо (несущественно) отличным от нуля, и соответствующий фактор удаляется из модели. В противном случае будем говорить, что он значим, т.е. действительно не равен 0; соответствующий фактор тогда остается в модели.

Формально эта проверка производится следующим образом. Подсчитывается дисперсия оценки bi для i = 0,1,...,n:

 

1

N ~

 

 

1

N ~2

 

1

N ~2 1

r

D y

 

D[bi ] = D

 

xij y j

=

 

 

xij

D[ y j ] =

 

 

xij

 

 

D[ yij ] =

 

.

 

 

2

 

2

 

2

Nr

N

j =1

 

 

N

j =1

 

N

j =1 r

l =1

 

 

 

 

 

 

 

 

 

 

 

19

При выводе сделано предположение, что отдельные измерения равноточны и независимы. Символом D y обозначена дисперсия отдельного измерения от-

клика; точное значение этой дисперсии, как правило, неизвестно, и в расчетах используется ее оценка – дисперсия воспроизводимости S y2 . Далее определяется отношение

ti =

 

bi

 

(Nr)1/ 2

(1.12)

 

 

 

 

 

(S y2 )1/ 2

 

 

 

и сравнивается с tкр = t(α1, s) – табличным значением распределения Стьюдента с s степенями свободы, соответствующим выбранному уровню значимости α1. Число s – это число степеней свободы, соответствующее дисперсии воспроизводимости: s = N(r–1), если S y2 определяется по формуле (1.10), и s = p – 1, если

S y2 определяется по формуле (1.11).

Согласно процедуре проверки гипотез правило принятия решения выглядит следующим образом: если ti >tкр, то коэффициент βi значим, в противном

случае коэффициент βi признается незначимо отличным от нуля и соответст-

вующий ему член исключается из модели. Из-за наличия помех решение может быть ошибочным, в частности, незначимый коэффициент может быть принят за значимый, однако вероятность такого события не превосходит α1.

Вместо t-критерия Стьюдента (1.12) можно использовать F-критерий Фишера. В этом случае отношение

ti2

 

b2 Nr

=

i

S y2

 

 

сравнивается с Fкр = F(α1,n1,n2 ) – табличным значением распределения Фишера с n1 =1 и n2 = s степенями свободы, соответствующим выбранному уровню значимости α1. Решение принимается аналогично тому, как это было

описано выше для критерия Стьюдента.

Рассматриваемые линейные планы обладают одним важным свойством, называемым ротатабельностью, которое заключается в том, что точность предсказания модели по всем направлениям факторного пространства одинакова. Докажем это свойство, для чего подсчитаем дисперсию отклика, предсказанного моделью:

20