Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции _ПЭиМС..docx
Скачиваний:
59
Добавлен:
27.05.2015
Размер:
575.23 Кб
Скачать

Лекция 9.

Проверка нормальности распределения. Критерий соответствия χ2 («хи-квадрат»). Приближенные методы проверки. Логарифмически нормальное распределение.

Проверка нормальности распределения

Все приведенные выше доверительные оценки как средних значений, так и дисперсий основаны на гипотезе нормальности закона распределения случайных ошибок измерения и поэтому могут применяться лишь до тех пор, пока результаты эксперимента не противоречат этой гипотезе.

Если результаты эксперимента вызывают сомнение в нормальности закона распределения случайных ошибок, то для решения вопроса о пригодности или непригодности нормального закона распределения надо произвести достаточно большое число измерений и применить один из описанных ниже критериев.

Критерий соответствия χ2 («хи-квадрат»). Результаты измерений (разумеется, свободные от систематических ошибок) группируют по интервалам таким образом, чтобы эти интервалы покрывали всю ось (- ∞, + ∞) и чтобы количество данных в каждом интервале было достаточно большим (во всяком случае не менее пяти, лучше десяти). Для каждого интервалаi-1 xi) под­считывают число mi результатов измерения, попавших в этот интервал. Затем вычисляют вероятность рi попадания в этот интервал при нормальном законе распределения вероятностей:

, (1)

где - среднее арифметическое значение результатов измерения,

s - эмпирический стандарт (средняя квадра тическая ошибка),

Ф — интеграл вероятностей, представленный в (прилож, стр. 171 и 172).

Наконец, вычисляют сумму:

, (2)

где - число всех интервалов (-∞, х1), (x1, х2), ….() n - число всех результатов измерений (п = тг + m2 + … +mi)/

Если сумма (2) окажется больше критического значения (прилож, стр. 179) при некоторой доверительной вероятности и числе степеней свободы k = l - 3, то с надежностью можно считать, что распределение вероятностей случайных ошибок в рассматриваемой серии измерений отличается от нор­мального. В противном случае для такого вывода нет достаточных оснований.

При отсутствии достаточных оснований для того, чтобы отвергнуть гипотезу о нормальном распределении случайных ошибок измерения, эта гипотеза принимается, так как в обычных ситуациях эта гипотеза часто может быть обоснована теоретически. Однако следует иметь в виду, что даже малая величина суммы (2) не может служить доказательством нормальности закона распределения.

Отметим еще важное свойство критерия если распределение отлично от нормального, то при достаточно большом числе измерений сумма (2) превысит соответствующее критическое значение . Поэтому, если при произведенном числе измерений критерий дал малую надежность, но сомнение в нормальности распределения осталось, то следует увеличить число измерений (в несколько раз!).

Указанное выше число степеней свободы k = l - 3 относится только к тому случаю, когда оба параметра нормального закона распределения определяются по результатам измерений, т. е. когда вместо точных значений а и σ применяются их эмпирические значения и s. Если значение а точно известно (например, при измерении эталона), то число степеней свободы равно k = l - 2, если известны оба параметра а и σ, то число степеней свободы равно k = l — 1. На практике такая ситуация встречается редко, и поэтому для получения числа степеней свободы не менее пяти надо брать число интервалов не менее восьми.

В заключение заметим, что эффективность критерия повышается, если в каждый из выделенных интервалов попадает примерно одинаковое количество данных. Это следует учитывать при группировке первичного материала (если возможно).

Приближенные методы проверки. Применение критерия соответствия требует довольно значительных расчетов.

В качестве приближенного метода проверки нормальности распределения применяют метод, связанный с оценками центральных моментов третьего и четвертого порядков μ3 и μ4. В случае нормального распределения случайных ошибок эти моменты равны соответственно μ3 = 0 и μ4 = 3σ4. Оценками этих моментов по результатам эксперимента служат эмпирические центральные моменты М3 и М4. В случае нормального распределения должны выполняться приближенные равенства М3 ≈ 0, M4 3s4. Для удобства сравнения подсчитывают безразмерные характеристики:

показатель асимметрии

gs = M3/ s3

и эксцесс

E = M4/s4 -3

где s — эмпирический стандарт ошибки. Обе эти характеристики должны быть малы, если распределение нормально. О малости этих характеристик обычно судят по сравнению их с их средними квадратическими ошибками, соответственно равными

, для gs,

, для Е

где n - количество измерений. Если хотя бы одна из указанных характеристик по абсолютной величине значительно (в 2—3 раза) превосходит свою среднюю квадратическую ошибку, то нормальность закона распределения следует подвергнуть сомнению и провести более тщательный анализ результатов эксперимента (например, с помощью критерия ). В противном случае для такого сомнения нет оснований.

Логарифмически нормальное распределение. В тех случаях, когда гипотеза о нормальном законе распределения оказывается в противоречии с экспериментальными данными (т. е. отвергается каким-либо из указанных выше критериев), применение оценок, изложенных в настоящей главе, может оказаться несостоятельным. Но иногда удается найти такое преобразование результатов измерения Xi что преобразованные величины Yi = f (Xi) следуют нормальному закону распределения. В этом случае изложенные выше оценки можно применить к преобразованным величинам Yi, а затем уже пересчитать их на величины Xi.

Например, часто встречается случай, когда нормальному распределению следуют не сами результаты измерения, а их логарифмы. Такой случай возникает тогда, когда факторы, искажающие результат измерения, вызывают эффект, пропорциональный самому результату измерения (т. е. когда устойчивыми в среднем оказываются не абсолютные, а относительные ошибки измерения). При этом говорят, что сам результат измерения X следует логарифмически нормальному распределению. Если обозначить ln Х = Y, т. е. X = eY, то из оценки центра распределения величины Y:

,

получается следующая оценка среднего значения величины X:

= ,

это свидетельствует о целесообразности применения здесь не среднего арифметического, а среднего геометрического значения. Доверительная оценка для центра распределения величины Yi, имеет вид

это приводит к следующей доверительной оценке для среднего значения величины X:

при больших n последнее соотношение т.е. может быть истолковано как оценка относительной ошибки.

Лекция 10.

Основные понятия планирования эксперимента.

Мысль о том, что эксперимент можно планировать, восходит к глубокой древности. Наш далекий предок, убедившийся, что острым камнем можно убить даже мамонта, несомненно выдвигал гипотезы, которые после целенаправленной экспериментальной проверки привели к созданию копья, дротика, а затем и лука со стрелами.

Он, однако, не пользовался статистическими методами, поэтому остается непонятным, как он вообще выжил и обеспечил тем самым наше существование.

Только в начале нашего века люди, наконец, поняли, что дальше дело так не пойдет, и придумали статистические методы планирования эксперимента. Честь открытия этой идеи принадлежит английскому статистику Рональду Фишеру (конец двадцатых годов), который впервые показал целесообразность одновременного варьирования всеми факторами в противовес широко распространенному однофакторному эксперименту. Понадобилось еще несколько десятилетий, чтобы в начале пятидесятых годов появилось новое направление в планировании эксперимента, связанное с оптимизацией процессов, – планирование экстремального эксперимента. Первая работа в этой области была опубликована в 1951 г. Боксом и Уилсоном в Англии. Идея метода Бокса–Уилсона крайне проста. Экспериментатору предлагается ставить последовательные небольшие серии опытов, в каждой из которых одновременно варьируются по определенным правилам все факторы. Серии организуются таким образом, чтобы после математической обработки предыдущей можно было выбрать условия проведения (т.е. спланировать) следующую серию. Так последовательно, шаг за шагом, достигается область оптимума.

Применение планирования эксперимента делает поведение экспериментатора целенаправленным и организованным, существенно способствует повышению производительности его труда и надежности полученных результатов. Важным достоинством метода является его универсальность, пригодность в огромном большинстве областей исследования, интересующих современного человека. В нашей стране планирование эксперимента развивается с 1960 г. под руководством В. В. Налимова.

Интерес исследователей к планированию эксперимента вполне понятен: перспектива сократить число опытов, найти оптимум, получить количественные оценки влияния факторов и определить ошибки – крайне привлекательна.

Но, когда экспериментатор делает попытку познакомиться с планированием эксперимента, он часто сталкивается с серьезными трудностями. Больше того, иногда он просто неверно применяет методы планирования или выбирает не самый оптимальный для данной ситуации путь исследования, или допускает еще какие–нибудь досадные ошибки. При этом снижается эффективность его работы и появляется опасность дискредитации важного и полезного направления.

Большинство научных исследований связано с экспериментом. Он проводится в лабораториях, на производстве, на опытных полях и участках, в клиниках и т.д. Эксперимент может быть физическим, психологическим или модельным. Он может непосредственно проводиться на объекте или на его модели. Модель обычно отличается от объекта масштабом, а иногда природой.

Как вы считаете, можно ли поставить эксперимент на абстрактной математической модели?

Если модель достаточно точно описывает объект, то эксперимент на объекте может быть заменен экспериментом на модели. В последнее время наряду с физическими моделями все большее распространение получают абстрактные математические модели. Можно получать новые сведения об объекте, экспериментируя на модели, если она достаточно точно описывает объект.

Эксперимент занимает центральное место в науке. Однако возникает вопрос, насколько эффективно он используется. Джон Бернал, например, отмечал, что научные исследования организуются и проводятся настолько хаотично, что их коэффициент полезного действия может быть оценен величиной порядка 2 %. Для того чтобы повысить эффективность исследований, требуется нечто совершенно новое. Одним из возможных путей является применение математических методов, построение математической теории планирования эксперимента.

Планирование эксперимента – это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. При этом существенно следующее:

  • стремление к минимизации общего числа опытов;

  • одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам – алгоритмам;

  • использование математического аппарата, формализующего многие действия экспериментатора;

  • выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.

Задачи, для решения которых может использоваться планирование эксперимента, чрезвычайно разнообразны.

Поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей (например, кинетических), выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм состав–свойство – вот примеры задач, при решении которых применяется планирование эксперимента. Можно сказать, что там, где есть эксперимент, имеет место и наука о его проведении – планирование эксперимента.

Поиск оптимальных условий является одной из наиболее распространенных научно–технических задач. Они возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (оптимальные в некотором смысле) условия его реализации.

Пусть, например, у химика возникла гипотеза о том, что при взаимодействии двух веществ должен получаться некоторый интересующий его продукт. Чтобы убедиться в правильности своей гипотезы, он начинает проводить эксперимент. Возможно, что ему повезло и он получил требуемый продукт. Однако выход продукта весьма низок, скажем, 2 %. Вот тут–то и возникает задача выбора оптимальных условий. Требуется так подобрать концентрации реагирующих веществ, температуру, давление, время реакции и другие факторы, чтобы сделать выход возможно более близким к 100 %. В данном примере находятся условия проведения процесса, оптимальные в смысле максимизации выхода требуемого продукта. Но это далеко не единственно возможная постановка задачи. Найденные условия оказались бы другими, если бы ставилась, например, цель минимизации себестоимости продукта или минимизации количества вредных примесей. Следует подчеркнуть, что всегда необходимо четко формулировать, в каком смысле условия должны быть оптимальными. Этим определяется выбор цели исследования. Точная формулировка цели в значительной мере определяет успех исследования.

Задачи, сформулированные аналогичным образом, называются задачами оптимизации. Процесс их решения называется процессом оптимизации или просто оптимизацией. Выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение – вот примеры задач оптимизации.

Эксперимент, который ставится для решения задач оптимизации, называется экстремальным. Это название связано с глубокой аналогией между оптимизацией и поиском экстремума некоторой функции. Давайте рассмотрим следующие две задачи.

1. Прочность бетона в значительной степени определяется маркой цемента, количеством наполнителя и количеством воды. Требуется установить связь между прочностью бетона и названными факторами.

2. Надежность некоторого полупроводникового прибора зависит от ряда технологических факторов. Требуется так подобрать значения этих факторов, чтобы надежность прибора повысилась.

Как вы думаете, какая из этих задач является экстремальной?

Чтобы облегчить вам выбор, укажем на признак, отличающий экстремальные задачи. Задача является экстремальной, если цель ее состоит в поиске экстремума некоторой функции. Чтобы установить, какая из двух задач является экстремальной, надо обратиться к их формулировкам и выяснить, где удовлетворяются требования экстремальности. В задаче 1 требуется установить связь между прочностью бетона и тремя факторами. Здесь не определено, какая прочность является оптимальной, и не требуется ее оптимизировать. В задаче 2 необходимо повысить надежность прибора. Сама постановка задачи указывает на то, что существующая надежность не удовлетворяет экспериментатора и требуется поиск таких условий, при которых ее значения повысятся. Задачи называем интерполяционными, а типа 2 – экстремальными.

Чтобы продвинуться дальше, нам придется определить еще ряд важных понятий, первое из которых – «объект исследования». Для описания объекта исследования удобно пользоваться представлением о кибернетической системе, которая схематически изображена на рисунке. Иногда такую кибернетическую систему называют «черным ящиком». Стрелки справа изображают численные характеристики целей исследования. Мы обозначаем их буквой игрек и называем параметрами оптимизации В литературе вы можете встретить другие названия: критерий оптимизации, целевая функция, выход «черного ящика» и т.д.

Для проведения эксперимента необходимо иметь возможность воздействовать на поведение «черного ящика». Все способы такого воздействия мы обозначаем буквой икс и называем факторами. Их называют также входами «черного ящика».

При решении задачи будем использовать математические модели объекта исследования. Под математической моделью мы понимаем уравнение, связывающее параметр оптимизации с факторами. Это уравнение в общем виде можно записать так:

y=(x1, x2, x3,…, xn)

где символ  ( ), как обычно в математике, заменяет слова: «функция от». Такая функция называется функцией отклика.

Каждый фактор может принимать в опыте одно из нескольких значений. Такие значения будем называть уровнями. Может оказаться, что фактор способен принимать бесконечно много значений (непрерывный ряд). Однако на практике точность, с которой устанавливается некоторое значение, не беспредельна. Поэтому мы вправе считать, что всякий фактор имеет определенное число дискретных уровней. Это соглашение существенно облегчает построение «черного ящика» и эксперимента, а также упрощает оценку их сложности.

Фиксированный набор уровней факторов (т.е. установление каждого фактора на некоторый уровень) определяет одно из возможных состояний «черного ящика». Одновременно это есть условия проведения одного из возможных опытов. Если перебрать все возможные наборы состояний, то мы получим полное множество различных состояний данного «ящика». Одновременно это будет число возможных различных опытов.

Чтобы узнать число различных состояний, достаточно число уровней факторов (если оно для всех факторов одинаково) возвести в степень числа факторов k: pk, где р – число уровней.

Yа первый взгляд простая система с пятью факторами на пяти уровнях имеет 3125 состояний, а для десяти факторов на четырех уровнях их уже свыше миллиона!

В этих условиях мы просто вынуждены отказаться от таких экспериментов, которые включают все возможные опыты: перебор слишком велик. Тогда возникает вопрос: сколько и каких опытов надо включить в эксперимент, чтобы решить поставленную задачу? Здесь–то и приходит на помощь планирование эксперимента.

Однако нужно иметь в виду, что при планировании эксперимента не безразлично, какими свойствами обладает объект исследования. Укажем два основных требования, с которыми приходится считаться. Прежде всего существенно, воспроизводятся ли на объекте результаты эксперимента. Выберем некоторые уровни для всех факторов и в этих условиях проведем эксперимент. Затем повторим его несколько раз через неравные промежутки времени и сравним значения параметра оптимизации. Разброс этих значений характеризует воспроизводимость результатов. Если он не превышает некоторой заранее заданной величины (наших требований к точности эксперимента), то объект удовлетворяет требованию воспроизводимости результатов, а если превышает, то не удовлетворяет этому требованию. Мы будем рассматривать только такие объекты, для которых требование воспроизводимости выполняется.

Планирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес. Поэтому такой эксперимент называется активным. Объект, на котором возможен активный эксперимент, называется управляемым. Это и есть второе требование к объекту исследования.

На практике нет абсолютно управляемых объектов. На реальный объект обычно действуют как управляемые, так и неуправляемые факторы. Неуправляемые факторы влияют на воспроизводимость эксперимента и являются причиной ее нарушения. Если требования воспроизводимости не выполняются, приходится обращаться к активно–пассивному эксперименту.

Возможно, плохая воспроизводимость объясняется действием фактора, систематически изменяющегося (дрейфующего) во времени. Тогда нужно обращаться к специальным методам планирования. Наконец, возможно, что все факторы неуправляемы. В этом случае возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений за поведением объекта, или, как говорят, по результатам пассивного эксперимента.

Планирование экстремального эксперимента – это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий, т. е. для решения поставленной задачи.

Понятие «объект исследования» требует точного формального определения. Для такого определения удалось приспособить кибернетическое понятие «черный ящик» – модель объекта. Экспериментатор, вставший на путь применения методов планирования эксперимента, должен уметь формулировать свою задачу в терминах «черного ящика».

Входы «черного ящика» называются факторами. Каждый фактор может принимать некоторое определенное число различных значений, называемых уровнями. Сочетание определенных уровней всех факторов определяет возможное состояние «черного ящика» и условия одного из возможных опытов.

Совокупность всех различных возможных состояний определяет сложность «черного ящика» и общее число возможных опытов.

Результаты эксперимента используются для получения математической модели объект исследования, которая представляет собой уравнение, связывающее параметр оптимизации и факторы. Такое уравнение называется функцией отклика.

Использование для получения модели всех возможных опытов приводит к абсурдно, большим экспериментам. Задача выбора необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений – это и есть задача планирования эксперимента. Частный случай этой задачи – планирование экстремального эксперимента, т. е. эксперимента, поставленного с целью поиска оптимальных условий функционирования объекта. Планирование экстремального эксперимента – метод выбора минимального количества опытов, необходимых для отыскания оптимальных условий.

Под экспериментом будем понимать метод научного исследования, когда исследователь активно и целенаправленно воздействует на объект исследования путем создания искусственных условий или использования естественных с целью получения информации о его свойствах.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

Под планом эксперимента – понимается совокупность данных, определяющих число, условия и порядок реализации опытов. Под словом опыт в данном случае имеется в виду отдельная, элементарная часть эксперимента. Соответственно, понятие планирование эксперимента, определяемое как процесс разработки плана эксперимента, включает в себя все, что делается по разработке стратегии экспериментирования от начальных до заключительных этапов изучения объекта исследования, т.е. от получения априорной информации до создания работоспособной математической модели объекта исследования или определения оптимальных условий. Планирование способствует значительной интенсификации труда исследователя и сокращению затрат на эксперимент, повышению достоверности полученных результатов исследования.

Основным математическим аппаратом теории планирования эксперимента является теория вероятностей и математическая статистика.

Многомерное факторное пространство – это множество точек, каждая из которых соответствует определенной комбинации факторов. Область возможных комбинаций факторов называется областью возможных (допустимых) планов эксперимента.

Вектор, образуемый выходными параметрами–характеристиками свойств или качеств объекта, называют откликом, а зависимость отклика от рассматриваемых факторов – функцией отклика. Геометрическое представление функции отклика в факторном пространстве называют поверхностью отклика. Функцию отклика называют также целевой функцией, имея в виду, что при планировании эксперимента с целью нахождения оптимальных условий она является критерием оптимальности.

Планирование эксперимента проводится в несколько этапов :

  • постановка задачи (определение цели эксперимента, выяснение исходной ситуации, оценка допустимых затрат времени и средств, установление типа задачи);

  • сбор априорной информации (получение литературы, опрос специалистов и т.п.);

  • выбор способа решения и стратегии его реализации (установление типа модели, выявление возможных влияющих факторов, выявление выходных параметров, выбор целевых функций, создание необходимых нестандартных технических средств, формулировка статистических задач, выбор или разработка алгоритмов программ обработки экспериментальных данных).

Основными концепциями современного подхода к организации эксперимента являются рандомизация, многофакторность и автоматизация.

Сущность рандомизации состоит в следующем. Любое экспериментальное исследование проводится, как правило, в условиях действия систематических ошибок и факторов, которые трудно поддаются учету и контролю. При традиционном подходе к эксперименту исследователи нередко пытаются отделить изучаемое явление от мешающих факторов, как это можно сделать в детерминированных объектах с хорошо изученной структурой. Очевидно, что в недетерминированных объектах с огромным количеством случайных факторов ценность эксперимента, проведенного в особых условиях, не может быть высокой.

Концепция рандомизации предлагает принципиально новый подход к организации выборочных данных эксперимента. План эксперимента составляется таким образом, чтобы рандомизировать, то есть сделать случайными в пространстве и во времени, систематически действующие мешающие факторы. Тогда эти факторы можно рассматривать как случайные величины и, следовательно, учесть статистически их влияние в значении ошибки эксперимента. Иными словами, в противоположность традиционному подходу к эксперименту со стремлением стабилизировать мешающие факторы рандомизация внесла концепцию случая в эксперимент.

Принцип многофакторности отражает новый подход к эксперименту в задачах с многими факторами. При изучении объектов с несколькими факторами согласно этому принципу исследователю предлагается ставить опыты так, чтобы варьировать все факторы сразу в отличие от традиционного подхода, когда исследователь пытается изучать действие каждого фактора при поочередном варьировании. Организация эксперимента с применением многофакторных схем варьирования позволяет повысить точностью оценок параметров подбираемых моделей для недетерминированных объектов, точнее оценить чувствительность выходной зависимой переменной объекта к вариации изучаемых входных независимых переменных.

Развитие технических программных средств вычислительной техники дает возможность говорить о новой концепции в организации научных исследований – автоматизации эксперимента. Технические средства вычислительных комплексов позволяют на качественно новом уровне по точности, быстродействию и наглядности решать задачи сбора, переработки и отображения информации. Программные средства предоставляют исследователю новые возможности организации процесса анализа данных, создания автоматически управляемой последовательности процедур анализа, использования интерактивного режима работы с пакетами прикладных программ.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

  • планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

  • планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

  • планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

  • планирование экстремального эксперимента, в котором главная задача – экспериментальная оптимизация объекта исследования;

  • планирование при изучении динамических процессов и т.д.

При пассивном эксперименте существуют только факторы в виде входных контролируемых, но неуправляемых переменных, и экспериментатор находится в положении пассивного наблюдателя. Задача планирования в этом случае сводится к оптимальной организации сбора информации и решению таких вопросов, как выбор количества и частоты измерений, выбор метода обработки результатов измерений.

Наиболее часто целью пассивного эксперимента является построение математической модели объекта, которая может рассматриваться либо как хорошо, либо как плохо организованный объект. В хорошо организованном объекте имеют место определенные процессы, в которых взаимосвязи входных и выходных параметров устанавливаются в виде детерминированных функций. Поэтому такие объекты называют детерминированными. Плохо организованные или диффузные объекты представляют собой статистические модели. Методы исследования с использованием таких моделей не требуют детального изучения механизма процессов и явлений, протекающих в объекте.

Однофакторный пассивный эксперимент проводится путем выполнения n пар измерений в дискретные моменты времени единственного входного параметра х и соответствующих значений выходного параметра y. Аналитическая зависимость между этими параметрами вследствие случайного характера возмущающих воздействий рассматривается в виде зависимости математического ожидания y от значения х, носящей название регрессионной. Соответствующая линия А В показана на графике (рис.1).

Рис 9.1. График регрессионной зависимости y от х

Множество всех точек проведения экспериментов xi=(xi1, xi2, … , xin), i = 1, 2, …. N представляется с помощью матрицы

и называется планом эксперимента

Целью однофакторного пассивного эксперимента является построение регрессионной модели. Следует отметить, что регрессионная модель является приближенной оценкой истинной регрессионной зависимости. Для построения модели следует провести обоснованный выбор аппроксимирующей функции. Критериями выбора являются простота, удобство пользования, обеспечение требуемой точности аппроксимации, адекватность. Адекватная регрессионная модель позволяет предсказывать с требуемой точностью значения выходной величины в некоторой области значений входной.

Нередко для выбора аппроксимирующей функции пользуются кривой регрессионной зависимости, проведенной "на глаз".

Чаще всего регрессионная модель представляется с помощью аппроксимирующей функцией в виде полинома

. (2)

Приняв такую модель, следует определиться в порядке полинома, после чего вычислить параметры а1, а2 ,…,аm.

В общем случае результаты измерения li значения выходной величины и ее значения yi определяемые регрессионной зависимостью от входного фактора xi, не совпадают, т.е. отлична от нуля разность Di = li–yi, что связано с наличием погрешности измерения и возмущающих воздействий. Обычно считают, что Di не зависит от значения y (т.е. аддитивна) и подчиняется нормальному закону распределения с нулевым математическим ожиданием.

Если выполнено n измерений, то их результаты можно записать в виде:

(3)

Система уравнений (3) линейна относительно aj. Для нахождения оценок aj из условия минимума Dj необходимо добиться равенства нулю всех частных производных функций по aj. Получим систему нормальных уравнений:

(j=1,2,…,m). (4)

Сгруппировав все коэффициенты при неизвестных aj и записав уравнения системы (4) в стандартном виде можно вычислить искомые параметры aj методом определителей.

Многофакторный пассивный эксперимент дает n значений выходного параметра y объекта, соответствующих измерениям n совокупностей значений выходных параметров:

x11, x12 ,…, x1k;

x21, x22 ,…, x2k;

.……...............

xn1, xn2 ,…, xnk.,

где xij – значение j входного параметра в i–м измерении (j=1,2,...,n).

В качестве регрессионной модели примем линейный многочлен вида

у = а0 + а1х1 +a2x2+ …+ аkхk. (5)

Заменим переменные их центрированными значениями:

Тогда модель принимает вид

, (6)

На основе (6) составляется система нормальных уравнений вида (4) (с заменой m на k) и вычисляются оценки параметров . Затем вычисляется оценка

и осуществляется переход к исходной модели (5).

Тема 11. Общие требования к плану эксперимента. О критериях планирования эксперимента. Критерий ортогональности плана. Критерий ротатабельности. Критерий А-оптимальности. Критерий D-оптимальности. Критерий G-оптимальности.

Лекция 12.

Планы для моделей, описываемых полиномами первого порядка.

Вид модели. Полные факторные планы. Дробные факторные планы. Формулы для вычислений и свойства полных и дробных факторных планов для линейных моделей.

Полный факторный эксперимент типа 2к

Первый этап планирования эксперимента для получения линейной модели основан на варьировании факторов на двух уровнях. В этом случае, если число факторов известно, можно сразу найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов.

Простая формула, которая для этого используется, N = 2к, где N – число опытов, к – число факторов, 2 – число уровней. В общем случае эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом.

Если выбранная модель включает только линейные члены полинома и их произведения, то для оценки всех параметров модели используется план эксперимента с варьированием всех факторов на двух уровнях. Такие планы принято называть планами типа 2n, где 2n=N – число всех возможных опытов, n – количество варьируемых факторов.

Полный факторный эксперимент может быть предложен исследователю как один из способов построения математической модели (идентификации) недетерминированного объекта. Этот способ оказывается наиболее предпочтительным в тех случаях, когда отсутствует априорная информация для обоснования структуры модели с позиций физико-химических представлений процессов, происходящих в объекте, отсутствует количественная оценка степени влияния изучаемых факторов на выходную переменную объекта, его выходной показатель.

Нетрудно написать все сочетания уровней в эксперименте с двумя факторами. Напомним, что в планировании эксперимента используются кодированные значения факторов: +1 и –1 (часто для простоты записи единицы опускают). Условия эксперимента можно записать в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов. Будем называть такие таблицы матрицами (репликами) планирования эксперимента.

Каждый столбец в матрице планирования называют вектор-столбцом, а каждую строку – вектор-строкой.

Матрица планирования 22 для двух факторов показана в табл.

Номер опыта

Матрица планирования

Выход у

x1

x2

1

–1

–1

y1

2

+1

–1

y2

3

–1

+1

y3

4

+1

+ 1

y4

Таким образом, мы имеем два вектора-столбца независимых переменных и один вектор-столбец параметра оптимизаций. То, что записано в этой таблице в алгебраической форме, можно изобразить геометрически. Найдем в области определения факторов точку, соответствующую основному уровню, и проведем через нее новые оси координат, параллельные осям натуральных значений факторов. Далее, выберем масштабы по новым осям так, чтобы интервал варьирования для каждого фактора равнялся единице. Тогда условия проведения опытов будут соответствовать вершинам квадрата, центром которого является основной уровень, а каждая сторона параллельна одной из осей координат и равна двум интервалам (рис.). Номера вершин квадрата соответствуют номерам опытов в матрице планирования. Площадь, ограниченная квадратом, называется областью эксперимента. Иногда удобнее считать областью эксперимента площадь, ограниченную окружностью, описывающей квадрат. В задачах интерполяции область эксперимента есть область предсказываемых значений у.

На рис.1 показан в факторном пространстве симметричный двухуровневый план для двухфакторной функции отклика y = f(x1x2) при нейтральном (рис.1, а) и нормированном (рис.9.2,б) представлении уровней факторов. Здесь, – искомые натуральные уровни факторов, – нижние, – верхние уровни, , – интервалы варьирования.

Запись матрицы планирования, особенно для многих факторов, громоздка. Для ее сокращения удобно ввести условные буквенные обозначения строк.

Это делается следующим образом. Порядковый номер фактора ставится в соответствие строчной букве латинского алфавита: х1 – а, х2 – b, ... и т.д. Если теперь для строки матрицы планирования выписать латинские буквы только для факторов, находящихся на верхних уровнях, то условия опыта будут заданы однозначно. Опыт со всеми факторами на нижних уровнях условимся обозначать (1). Матрица планирования вместе с принятыми буквенными обозначениями приведена в табл. 2.

Номер опыта

Матрица планирования

Буквенные обозначения строк

Выход

у

x1

x2

1

–1

–1

(1)

y1

2

+1

–1

a

y2

3

–1

+1

b

y3

4

+1

+ 1

ab

y4

Теперь вместо полной записи матрицы планирования можно пользоваться только буквенными обозначениями, Ниже приведена буквенная запись еще одного плана: с, b, a, abc, (1), bc, aс, ab. Матрица планирования приведена в табл. 3.

Номер опыта

х1

х2

х3

Буквенные обозначения строк

у

1

–1

–1

+1

c

у1

2

–1

+1

–1

b

у2

3

+1

–1

–1

a

у3

4

+1

+1

+1

abc

у4

5

–1

–1

–1

(1)

у5

6

–1

+1

+1

bc

у6

7

+1

–1

+1

ac

у7

8

+1

+1

–1

ab

у8

Таким образом, вы построили полный факторный эксперимент 23. Он имеет восемь опытов и включает все возможные комбинации уровней трех факторов.

Если для двух факторов все возможные комбинации уровней легко найти прямым перебором (или просто запомнить), то с ростом числа факторов возникает необходимость в некотором приеме построения матриц. Из многих возможных обычно используется три приема, основанных на переходе от матриц меньшей размерности к матрицам большей размерности. Рассмотрим первый. При добавлении нового фактора каждая комбинация уровней исходного плана встречается дважды: в сочетании с нижним и верхним уровнями нового фактора. Отсюда естественно появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня. Вот как это выглядит при переходе от эксперимента. Этот прием распространяется на построение матриц любой размерности.

Рассмотрим второй прием. Для этого введем правило перемножения столбцов матрицы. При построчном перемножении двух столбцов матрицы произведение единиц с одноименными знаками дает +1, а с разноименными –1. Воспользовавшись этим правилом, получим для случая, который мы рассматриваем, вектор-столбец произведения х1х2 в исходном плане. Далее повторим еще раз исходный план, а у столбца произведений знаки поменяем на обратные Этот прием тоже можно перенести на построение матриц любой размерности, однако он сложнее, чем первый.

Третий прием основан на правиле чередования знаков. В первом столбце знаки меняются поочередно, во втором столбце они чередуются через два, в третьем – через 4, в четвертом – через 8 и т.д. по степеням двойки.

По аналогии с полным факторным экспериментом 22 можно дать геометрическую интерпретацию полного факторного эксперимента 23. Геометрической интерпретацией полного факторного эксперимента 23 служит куб, координаты вершин которого задают условия опытов.

Если поместить центр куба в точку основного уровня факторов, а масштабы по осям выбрать так, чтобы интервал варьирования равнялся единице, то получится куб, изображенный на рис. Куб задает область эксперимента, а центр куба является ее центром.

Фигура, задающая область эксперимента в многомерном пространстве, является некоторым аналогом куба. Будем называть эту фигуру гиперкубом.