Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Климушев Н.К. Прудникова О.М. ОНИ

.pdf
Скачиваний:
27
Добавлен:
11.06.2015
Размер:
639 Кб
Скачать

31

Матрица планирования при однофакторном эксперименте приведена в табл. 1. В ней +1 указывает, что объект находится на весах, а –1 означает, что объекта на весах нет. Масса объекта А равна Ga = y1 – y0, дисперсия результатов взвешивания σ2(Ga) = 2σ2(y). Аналогично подсчитываются также массы объектов В и С, дисперсия результатов взвешивания та же.

 

 

 

 

Табл. 1

Матрица планирования при однофакторном эксперименте

 

 

 

 

 

Номер опыта

А

В

С

Результат взвешивания

 

 

 

 

 

1

-1

-1

-1

y0

2

+1

-1

-1

y1

3

-1

+1

-1

y2

4

-1

-1

+1

y3

Эксперимент по взвешиванию можно провести по другой схеме: вначале последовательно взвешивают объекты А, В и С, а затем в последнем, четвертом опыте взвешивают все три объекта вместе. Холостого взвешивания не проводят. Матрица независимых переменных при взвешивании трех навесок щепы А, В и С показана в табл. 2. По этой схеме масса объекта Ga = (– y1 + y2 – y3 + y4)/2, а дисперсия σ2(Ga) = σ2(y). По аналогичной схеме подсчитываются массы объектов В и С, для которых дисперсия имеет то же значение.

 

 

 

 

Табл. 2

Матрица планирования при многофакторном эксперименте

 

 

 

 

 

Номер опыта

А

В

С

Результат взвешивания

 

 

 

 

 

1

-1

-1

+1

у1

2

+1

-1

-1

у2

3

-1

+1

-1

у3

4

+1

+1

+1

у4

Сравнение результатов показывает, что несмотря на равное число опытов, взвешивание по второй схеме позволило получить результат вдвое точнее, чем при взвешивании по первой схеме. Это достигается за счет того, что в первой схеме массу каждого объекта получали в результате двух опытов, а во второй – четырех.

32

Вторая схема взвешивания называется многофакторной. В многофакторном эксперименте оперируют всеми факторами так, чтобы каждый искомый результат можно было бы определить по результатам всех опытов, проведенных в данной серии экспериментов.

Сопоставление однофакторного и многофакторного экспериментов показывает преимущество последнего. Это преимущество значительно возрастает при увеличении числа факторов, влияние и взаимодействие которых требуется исследовать экспериментально.

Планирование эксперимента позволяет либо сократить трудоемкость, либо повысить точность по сравнению с непродуманным экспериментом. Математическое планирование дает наибольший эффект в тех многофакторных экспериментах, в которых ведется поиск оптимальных решений. Математический аппарат теории планирования эксперимента включает теорию вероятностей, математическую статистику и математическое программирование. Мощным импульсом теории и практики планирования эксперимента являются успехи вычислительной техники и появление автоматизированных систем обработки результатов эксперимента.

В общем виде планирование эксперимента включает следующие этапы: сбор и анализ априорной информации; выбор входных и выходных переменных, области экспериментирования; выбор математической модели, с помощью которой будут представляться экспериментальные данные; выбор критерия оптимальности (если требуется по условию задачи исследования) и плана эксперимента; определение метода анализа данных эксперимента; проведение эксперимента; проверка статистических предпосылок для полученных экспериментальных данных; обработка результатов, интерпретация и рекомендации.

Планирование эксперимента начинается с постановки задачи и выбора объекта исследования.

Объектом исследования называется объект, обладающий определенными свойствами и качествами, подлежащими изучению в соответствии с задачей эксперимента. Любой объект исследования можно представить в виде кибернетической модели «черного ящика» с переменными воздействиями входа и реакцией выхода (рис. 2).

Объектами исследования могут быть реальные физические объекты, процессы и явления, их физические и математические модели и т.п.

33

Объекты исследования должны обладать двумя обязательными качествами: позволять при тщательно отработанной методике испытаний получать воспроизводимые результаты и быть управляемыми.

 

Е

 

 

 

 

 

 

Х

Объект

е

Y

 

исследования

 

 

 

 

 

 

 

Z

 

 

Рис. 2. Структурная схема объекта исследования с аддитивной помехой

Эксперимент называется воспроизводимым, если разброс результатов опыта контролируется и не превышает заранее заданного значения. Объект является управляемым, если на нем возможен активный эксперимент. Различают пассивный и активный эксперимент. Если экспериментатор не может влиять на ход эксперимента, находится в роли пассивного наблюдателя, то речь идет о пассивном эксперименте (наблюдении). Если эксперимент подчинен воле экспериментатора, может проводиться по заданной программе, то имеет место активный эксперимент. Планировать можно только активный эксперимент.

Все переменные, определяющие состояние объекта, разделяют на четыре основные группы. Это три группы способов воздействия на объект исследования: 1) контролируемые и управляемые переменные Х, значения которых экспериментатор может варьировать в процессе эксперимента; 2) контролируемые, но неуправляемые переменные Z; 3) неконтро-лируемые и неуправляемые переменные E. К четвертой группе переменных относят переменные выхода Y, которые характеризуют поведение или свойства объекта в процессе эксплуатации.

Переменные Е отражают влияние случайных эффектов, которые являются причиной возникновения шумового поля и непредсказуемого дрейфа изучаемых характеристик объекта. На рис. 2 шумовое поле приведено к аддитивной составляющей e измеряемых показателей выхода.

34

Контролируемые переменные X и Z называются факторами. Факторы могут быть детерминированные (чаще факторы Х) и случайные (чаще факторы Z). Далее рассматриваем только влияние детерминированных факторов Х.

К факторам предъявляются требования дискретности, совместимости и некоррелированности. Дискретность позволяет поддерживать значение фактора на заданном уровне или же осуществлять переход на другой уровень воздействий. Совместимость означает, что в эксперименте имеется возможность задавать такие сочетания факторов, которые не искажают исследуемый процесс. Выполнение требования некоррелированности позволяет в эксперименте значения каждого из факторов изменять независимо друг от друга. В общем случае, если между факторами наблюдается нелинейная связь, то факторы являются некоррелированными.

Выходные показатели Y называют откликом объекта исследования на воздействие факторов Х, зависимость отклика от факторов – функцией отклика, а ее геометрическую интерпретацию – поверхностью отклика.

Математическая модель объекта исследования – это система уравнений или неравенств, которая отражает содержание, структуру и количественные связи, характеризующие объект исследования. В теории планирования эксперимента применяют регрессионные математические модели вида:

Y = ϕ (X, Θ) + e, (1)

где Θ – вектор параметров модели.

Регрессионная модель (1) отражает форму связи и количественные соотношения между факторами X и Y в условиях шумового поля e, неизбежного в реальном эксперименте. Наибольшее распространение получили полиномиальные регрессионные модели.

Планирование модельных экспериментов преследует две основные цели:

сокращение общего объема испытаний при соблюдении требований к достоверности и точности их результатов;

повышение информативности каждого из экспериментов в отдельности.

Поиск плана эксперимента производится в так называемом факторном пространстве.

Факторное пространство – это множество внешних и внутренних параметров модели, значения которых исследователь может контролировать в ходе подготовки и проведения модельного эксперимента. Область возможных зна-

чений факторов называется областью планирования эксперимента.

35

Каждый из факторов имеет верхний и нижний уровни, расположенные симметрично относительно некоторого нулевого уровня. Точка в факторном пространстве, соответствующая нулевым уровням всех факторов, называется

центром плана.

Интервалом варьирования фактора называется некоторое число J, прибавление которого к нулевому уровню дает верхний уровень, а вычитание – нижний.

Как правило, план эксперимента строится относительно одного (основного) выходного скалярного параметра Y, который называется наблюдаемой переменной. Если моделирование используется как инструмент принятия решения, то в роли наблюдаемой переменной выступает показатель эффективности.

При этом предполагается, что значение наблюдаемой переменной, полученное в ходе эксперимента, складывается из двух составляющих:

y = f(x) + e(x), (2)

где f(x) – функция отклика (неслучайная функция факторов); e(x) – ошибка эксперимента (случайная величина);

х– точка в факторном пространстве (определенное сочетание уровней факторов).

Очевидно, что y является случайной переменной, так как она зависит от случайной величины е(х).

Дисперсия Dy наблюдаемой переменной, которая характеризует точность измерений, равна дисперсии ошибки опыта: Dy = De.

Dy называют дисперсией воспроизводимости эксперимента. Она характеризует качество эксперимента. Эксперимент называется идеальным при Dy = 0.

Существует два основных варианта постановки задачи планирования эксперимента:

1.Из всех допустимых выбрать такой план, который позволил бы получить наиболее достоверное значение функции отклика f(x) при фиксированном числе опытов.

2.Выбрать такой допустимый план, при котором статистическая оценка функции отклика может быть получена с заданной точностью при ми-

нимальном числе испытаний.

Решение задачи планирования в первой постановке называется стратегическим планированием эксперимента, во второй – тактическим планированием.

36

6.1. Стратегическое планирование эксперимента

Стратегическое планирование позволяет ответить на вопрос, при каком сочетании уровней внешних и внутренних факторов может быть получена наиболее полная и достоверная информация. При стратегическом планировании эксперимента должны быть решены две основные задачи:

1.Идентификация факторов.

2.Выбор уровней факторов.

Под идентификацией факторов понимается их ранжирование по степени влияния на значение наблюдаемой переменной (показателя эффективности).

По итогам идентификации целесообразно разделить все факторы на две группы: первичные и вторичные. Первичные – это те факторы, в исследовании влияния которых экспериментатор заинтересован непосредственно. Вторичные - факторы, которые не являются предметом исследования, но влиянием которых нельзя пренебречь.

Выбор уровней факторов производится с учетом двух противоречивых требований:

уровни фактора должны перекрывать (заполнять) весь возможный диапазон его изменения;

общее количество уровней по всем факторам не должно приводить к

чрезмерному объему моделирования.

Отыскание компромиссного решения, удовлетворяющего этим требованиям, и является задачей стратегического планирования эксперимента.

Способы построения стратегического плана. Эксперимент, в котором реализуются всевозможные сочетания уровней факторов, называется полным факторным экспериментом (ПФЭ).

Общее число различных комбинаций уровней в ПФЭ для k факторов можно определить:

N = l1 · l2 · ... · lk ,

(3)

где li – число уровней для i-го фактора.

Если число уровней для всех факторов одинаково, то N = Lk (L – число уровней).

Недостаток ПФЭ – большие затраты времени на подготовку и проведение эксперимента. Например, если в модели отражены 3 фактора, влияющие на значение выбранного показателя эффективности, каждый из которых имеет 4 возможных уровня (значения), то план проведения ПФЭ будет включать

37

64 эксперимента (N = 43). Поэтому применение ПФЭ целесообразно только в том случае, если в ходе эксперимента исследуется взаимное влияние всех факторов, фигурирующих в модели.

Если такие взаимодействия отсутствуют или их эффектом можно пренебречь, проводят частичный факторный эксперимент (ЧФЭ). Известны и применяются различные варианты построения планов ЧФЭ, например, рандомизированный план, латинский квадрат, дробный факторный эксперимент, эксперимент с изменением факторов по одному.

Рандомизированный план строится на случайном выборе сочетаний уровней для каждого прогона. При использовании этого метода отправной точкой в формировании плана является число экспериментов, которые считает возможным (или необходимым) провести исследователь.

Латинский квадрат – используется в том случае, когда проводится эксперимент с одним первичным фактором и несколькими вторичными. Суть такого планирования состоит в следующем. Если первичный фактор А имеет l уровней, то для каждого вторичного фактора также выбирается l уровней. Выбор комбинации уровней факторов выполняется на основе специальной процедуры: пусть в эксперименте используется первичный фактор А и два вторичных фактора – В и С, число уровней факторов l равно 4. Соответствующий план можно представить в виде квадратной матрицы размером l х l (4 х 4) относительно уровней фактора А (табл. 3). При этом матрица строится таким образом, чтобы в каждой строке и в каждом столбце данный уровень фактора А встречался только один раз. В результате имеем план, требующий 4 х 4 = 16 прогонов, в отличие от ПФЭ, для которого нужно 43 = 64 прогона.

 

 

 

 

 

 

Табл. 3

 

Пример латинского квадрата

 

 

 

 

 

 

 

 

Значение фактора В

 

 

Значение фактора С

 

 

 

 

 

 

 

 

 

 

С1

С2

 

С3

С4

В1

 

А1

А2

 

А3

А4

В2

 

А2

А3

 

А4

А1

 

 

 

 

 

 

 

В3

 

А3

А4

 

А1

А2

В4

 

А4

А1

 

А2

А3

 

 

 

 

 

 

 

Эксперимент с изменением факторов по одному. Суть его состоит в том,

что один из факторов «пробегает» все l уровней, а остальные n-1 факторов под-

38

держиваются постоянными. Такой план обеспечивает исследование эффектов каждого фактора в отдельности. Он требует всего N = l1 + l2 + ... + ln прогонов (li – число уровней i-го фактора). Для условий примера, рассмотренного в латинском квадрате, N = 4 + 4 + 4 = 12.

Дробный факторный эксперимент. Каждый фактор имеет два уровня – нижний и верхний, поэтому общее число вариантов эксперимента N = 2k, где k – число факторов. Матрица плана для дробного факторного эксперимента для k = 2 представлена в табл. 4.

Табл. 4

Матрица плана дробного факторного эксперимента для k =2

Номер эксперимента

 

Значение факторов

Х1

 

Х2

 

 

1

0

 

0

2

0

 

1

 

 

 

 

3

1

 

0

4

1

 

1

 

 

 

 

Планы, построенные по такому принципу, обладают определенными свойствами (симметричности, нормированности, ортогональности и ротатабельности), обеспечивающими повышение качества проводимых экспериментов.

6.2.Тактическое планирование эксперимента

Ктактическому планированию экспериментов относят совокупность методов установления необходимого числа испытаний.

Поскольку точность оценок наблюдаемой переменной характеризуется ее дисперсией, то основу тактического планирования эксперимента составляют так называемые методы понижения дисперсии.

6.2.1. Формирование простой случайной выборки

Если исследователь не обладает необходимой информацией о распределении наблюдаемой переменной и коррелированности между собой элементов выборки, то для повышения точности оценок применяется многократное по-

39

вторение экспериментов (прогонов модели) для каждого сочетания уровней факторов, выбранного на этапе стратегического планирования эксперимента. Такой подход получил название «формирование простой случайной выборки»

(ПСВ).

Если случайные значения наблюдаемой переменной не коррелированы и их распределение не изменяется от прогона к прогону, то выборочное среднее можно считать нормально распределенным. В этом случае число прогонов NТ, необходимое для того, чтобы истинное среднее наблюдаемой переменной лежало в интервале y ± b с вероятностью (1 – α), определяется следующим образом:

N

Т

=

Z 2

×Dy

,

(4)

 

b2

 

 

 

 

 

где Z – значение нормированного нормального распределения, которое определяется по справочной таблице при заданном уровне значимости

α/2;

Dy – дисперсия;

b – доверительный интервал.

Если требуемое значение дисперсии Dy до начала эксперимента неизвестно, выполняют пробную серию из L прогонов и вычисляют на ее основе выборочную дисперсию, значение которой подставляют в (4) и получают предварительную оценку числа прогонов NТ. Затем выполняют оставшиеся NТ L прогонов, периодически уточняя оценку и число прогонов NТ.

6.2.2. Методы понижения дисперсии

Основной недостаток методов планирования, основанных на использовании простой случайной выборки – медленная сходимость выборочных средних к истинным средним с ростом объема выборки NТ (пропорционально значению квадратного корня из NТ). Это приводит к необходимости использования методов уменьшения ошибок, не требующих увеличения NТ. Такие методы называются методами понижения дисперсии и делятся на три группы:

активные, предусматривающие формирование выборки специальным образом;

пассивные (применяются к уже сформированным выборкам);

косвенные, в которых для получения оценок наблюдаемой переменной используются значения некоторых вспомогательных величин.

40

Активных методов понижения дисперсии известно достаточно много. Выбор конкретного метода определяется, как правило, спецификой модели и целями эксперимента. К ним относятся методы повторения, подынтервалов, циклов. Они основаны на экспериментировании на модели либо при одинаковых начальных условиях, либо на дробном проведении экспериментов.

К пассивным методам понижения дисперсии относится метод стратифицированной выборки. Выборка разделяется на части, называемые слоями (стратами). При этом необходимо, чтобы значения элементов выборки как можно меньше различались внутри одного слоя и как можно больше – между различными слоями. Внутри каждого слоя производят случайный отбор элементов и вычисляют среднее значение слоя yi. Полученные оценки используют для вычисления математического ожидания по выборке в целом:

 

 

1

 

k

 

 

 

Y =

 

Ni yi ,

(5)

 

 

 

 

N i=1

 

 

где N, Ni

– объем всей выборки и i-го слоя соответственно,

 

k

число слоев.

 

 

 

 

 

Если считать, что оценки yi независимы, то дисперсия по выборке в целом

равна:

 

 

 

 

 

 

 

Dy =

1

k

Ni Dyi ,

(6)

 

 

 

 

N i=1

 

 

где Dyi дисперсия для i- го слоя.

При удачном выборе слоев величины Dyi будут малы, а значит, и выборочная дисперсия Dy будет предпочтительнее, чем для оценки, полученной методами простой случайной выборки.

Косвенные методы понижения дисперсии основаны на том, что зачастую некоторые из выходных характеристик модели получить (вычислить) легче, чем другие. Их использование предполагает не только весьма глубокое знание сущности процессов, протекающих в системе, но и наличие формального описания взаимной зависимости параметров модели.