pizhurin_a_a_pizhurin_a_a_modelirovanie_i_optimizaciya_proce
.pdfРассмотрим вначале систему автоматического регулирования влаж ности измельченной древесины, построенную по стандартному принципу регулирования по отклонению [21]. Ее структурная схема приведена на рис. 4.24.
Рис. 4.24. Схема системы автоматического регулирования влажности измельченной древесины
Сигналы с датчика температуры и влажности стружечной массы, соответственно х\ и х2, поступают в суммирующее устройство, которое вырабатывает сигнал х9 пропорциональный их взвешенной сумме: х = кххх+ к2х2. Значения коэффициентов к\ и к2 задают в зависимости от
требуемой степени влияния каждого из входных сигналов на процесс регу лирования. Суммарный сигнал х сравнивается с сигналом от задатчика, определяемым настройкой регулятора. Их разность через усилители воз действует на исполнительные механизмы, регулирующие количество и температуру топочных газов, подаваемых в сушильный барабан, а также на привод механизма подачи в него сырых стружек.
Принципиальным недостатком такого принципа регулирования яв ляется инерционность системы. Пусть в некоторый момент значения тем пературы и влажности стружечной массы отличаются от номинальных. Под действием системы регулирования эти параметры начнут изменяться в требуемом направлении через промежуток времени, складывающийся из продолжительности их измерения, продолжительности срабатывания ис
полнительных механизмов, времени, за которое произойдут соот ветствующие изменения режимов работы сушильного барабана, и, что са мое существенное, времени, требующегося на то, чтобы эти изменения сказались на параметрах высушенной стружечной массы. Инерционность, таким образом, является чертой, присущей прежде всего самому техноло гическому процессу.
Эффективность управления можно повысить с помощью системы, прогнозирующей выходные характеристики объекта. Для этого система управления должна включать его математическую модель. Схема такой системы управления показана на рис. 4.25. Здесь X , у и й - векторы входных, выходных и управляющих параметров соответственно. В устрой стве управления УУ, содержащем ЭВМ, заложена модель объекта j> = F (X ,u) - символическое обозначение совокупности зависимостей вы ходных параметров от входных и управляющих воздействий. Для нагляд ности на рисунке модель выделена из устройства управления.
Рис. 4.25. Схема системы управления, |
Рис. 4.26. Схема системы управления с |
использующей математическую |
адаптивной моделью объекта |
модель объекта |
|
Как видно из схемы, входное воздействие подается одновременно на объект, его модель и устройство управления. Модель прогнозирует зна чения выходных характеристик объекта, информация о которых поступает в устройство управления. Располагая ею, ЭВМ управляющего устройства решает задачу оптимального управления объектом, исходя из некоторого критерия оптимальности. В частности, это может быть задача нелинейного программирования. Вычисленные оптимальные значения компонент век тора й преобразуются в управляющие сигналы, которые поступают на входы исполнительных механизмов. Поскольку входные и выходные па раметры объекта изменяются с течением времени, управление системой необходимо осуществлять постоянно. Поэтому процесс решения оптими
163
зационной задачи непрерывно повторяется с заданной периодичностью. Продолжительность расчетов оптимальных режимов на ЭВМ значительно меньше, чем время реакции объекта на изменение входных и управляющих воздействий, благодаря чему подобный принцип регулирования и управ ления является более совершенным по сравнению с предыдущим.
Выше уже говорилось о том, что процесс построения модели техно логического процесса достаточно сложен. Если же, как в данном случае, модель должна использоваться для оперативного управления объектом, то становится необходимым учитывать временной дрейф его параметров, ко торый может быть вызван самыми разнообразными причинами. Иными словами, модель должна быть адаптивной, т. е. подстраивающейся к ха рактеристикам реального объекта. На рис. 4.26 показана схема такой само настраивающейся системы. Коррекция параметров модели осуществляется в ней с помощью блока коррекции (БК). Предварительно задается структу ра модели, например, многочлен первого или второго порядка, и некото рые начальные значения ее параметров.
В блок коррекции поступают входные воздействия X , а также раз ность векторов выходных параметров объекта и модели: А = у - у м. С ис пользованием этой информации в БК вычисляются параметры модели.
Эту задачу решают, исходя из минимума суммы квадратов разно стей между величинами у и у м) полученными за время измерения. Вы числения периодически повторяются с учетом изменений во времени воз действий х и Д. В результате непрерывно корректируется модель, а вме сте с ней и процесс управления объектом.
Рассмотрим реализацию этого принципа управления, исполь зующего адаптивную модель, применительно к процессу регулирования температуры и влажности стружечной массы, подвергающейся сушке в сушильном барабане. Соответствующая система автоматического регули рования схематически изображена на рис. 4.27. Обозначения РУЬ РУ2, РУз на схеме соответствуют устройствам, регулирующим температуру tHi коли чество Q топочных газов, подаваемых в сушильный барабан, и скорость vc подачи в него сырой стружки. Эти факторы, а также влажность Wc сырой стружки включены в математическую модель объекта.
Простейшая линейная модель будет в данном случае содержать две функции - зависимости влажности W и температуры t сухой стружечной массы от исследуемых параметров:
|
К = В 0+ BXWC+ B2vc + B3t4 + B4Q ; |
(4.120) |
|
t»=B'0 +B{Wc + B ’2vc + B'3tH+B'4Q9 |
(4.121) |
где |
значения выходных параметров W и t, предсказанные моде |
|
|
лью. |
|
Рис. 4.27. Схема системы автоматического регулирования температуры и влажности стружечной массы, использующая адаптивную
модель объекта
Параметры W и t образуют вектор у выходных параметров объекта:
у = (W, г), а факторы Wc, vc, t4n Q - вектор X входных параметров:
X = (Wc,v c,t4,Q).
Функционирование блока коррекции не отличается от рас смотренного выше общего случая. Управляющее же устройство решает здесь относительно простую задачу стабилизации, т. е. поддержания зна
чений выходных параметров: влажности W и температуры t стружечной массы на некоторых заданных уровнях W3 и t3. Для ее решения оно распо лагает информацией о значениях входных факторов Wc, vc, t4, Q и выход ных параметров WMи /м, рассчитанных на модели. Поэтому ЭВМ, имею щаяся в составе управляющего устройства, решает задачу минимизации функции:
ф =л, Ш - К ) 2+л2Е ( ^ - 0 2,
где Х\ и Л2- нормирующие множители, учитывающие относительную важ ность и требуемую точность стабилизации выходных параметров, а сум мирование проводится по всем моментам измерения входных и выходных величин.
Подставив в целевую функцию Ф выражения для WMи tM(4.120) и (4.121), можно сформулировать задачу регулирования данного процесса как отыскание значений входных переменных Wc, vc, tHи Q, обеспечиваю щих минимум целевой функции:
ф = - В о - W , - B2vc - B ,t4 - b 4q )2 +
+ Л2Х (/, -В'0 - B[WC- B’vc - B'3t4 - B'4q Y
при заданных диапазонах их варьирования и, возможно, некоторых допол нительных ограничениях. Значения входных переменных, найденные по результатам решения этой задачи, используются для управления исполни тельными механизмами подачи топлива в топку, а также поступления то почных газов и сырой стружки в сушильный барабан.
Самонастраивающиеся системы, работающие по рассмотренному выше принципу (см. рис. 4.26), называются беспоисковыми. Здесь пред полагается, что информации, получаемой от объекта в режиме естествен ного функционирования, достаточно для расчета параметров его модели и определения направления и величины изменения управляющих воздейст вий. В других случаях этой информации недостаточно. Недостающую ин формацию можно получить, если специально выводить систему из режима
ее естественного функционирования, фиксируя при этом значения вход ных и выходных параметров.
Для этого используют поисковые самонастраивающиеся систе мы. В них для отыскания параметров модели организуются дополнитель ные воздействия на объект, приводящие к так называемым пробным его движениям. Иными словами, устройство управления реализует на объекте планируемый эксперимент с целью получения математической модели объекта. Полученная модель используется этим же устройством для управления объектом. В данном примере варьируемыми переменными в таком эксперименте будут управляемые факторы Гч, Q и vc.
Широкое применение для управления технологическими про цессами нашли также поисковые самонастраивающиеся системы, в кото рых процедура поиска, т. е. организация упомянутых дополнительных воз действий на объект, непосредственно используется для оптимизации фукционирования системы с позиции достижения экстремума некоторого кри терия. Для этого обычно реализуется какая-либо из модификаций градиентного метода. По результатам пробных движений объекта устрой ство управления вычисляет компоненты вектора градиента для рас сматриваемого критерия оптимальности. Они используются для организа ции рабочих движений, т. е. изменения управляющих параметров, соот ветствующих перемещению в направлении градиента (в случае максими зации критерия оптимальности). В таких системах, которые называются
системами экстремального управления, не предполагается построение и использование модели объекта. В связи с этим все они имеют общий не достаток - относительно малое быстродействие.
167
Глава 5
ПРИМЕНЕНИЕ МЕТОДОВ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В ДЕРЕВООБРАБОТКЕ
5.1.Сущность метода динамического программирования
5.1.1.Основные понятия. Принцип оптимальности
Динамическое программирование - это один из методов решения сложных задач оптимизации. Его существенная особенность состоит в раз делении исследуемого процесса на этапы (шаги). Этапы могут соответст вовать, например, различным периодам времени функционирования сис темы, отдельным узлам или участкам рассматриваемого объекта, различ ным стадиям технологического процесса и т. д. Для каждого этапа решает ся задача оптимизации. Таким образом, решение сложной исходной задачи сводится к решению ряда более простых оптимизационных задач, взаимо связанных друг с другом.
Эффективность решения задачи оптимизации на некотором z-м эта пе характеризуется величиной критерия оптимальности со,. Достижение экстремума этого критерия обеспечивается отысканием значений управ ляющих переменных - элементов решения. В задачах динамического про граммирования их называют управлениями. Управление на каждом шаге ui - это вектор, состоящий из совокупности некоторого числа т управ
ляющих переменных:
В более сложных случаях компонентами вектора управления могут быть функции и даже качественные показатели, например: различные спо собы подготовки сырья, профили режущих инструментов, использование той или иной технологической схемы и т. п.
Предположим, что целевая функция W всей задачи определяется как сумма частных критериев по всем этапам процесса, т. е.
п |
(5.1) |
IF = 2 > ,, |
где п - число этапов. Такой критерий оптимальности называется аддитив-
ным.
Пусть, например, предстоит осуществить реконструкцию деревооб рабатывающего предприятия в течение п лет. В начале каждого года пред полагается вкладывать в реконструкцию определенные средства. Ежегод
ная прибыль предприятия зависит от объема средств, вложенных в его ре конструкцию в начале данного года. Требуется определить, сколько средств следует выделять на реконструкцию в начале каждого года при за данном их общем объеме, чтобы суммарная прибыль предприятия за п лет была максимальной. Сформулированная задача является простейшей зада чей распределения ресурсов. При решении ее методом динамического про граммирования естественно выделяются этапы, соответствующие первому году функционирования системы. Целевая функция на каждом этапе - прибыль, полученная предприятием в данном году. Величина критерия оп тимальности для всей задачи определится как сумма величин прибыли за все п лет. Управлением на каждом шаге будет единственная переменная - объем средств, вкладываемых в реконструкцию в начале каждого года.
Поэтапное решение задачи методом динамического программиро вания предполагает не обособленное, а взаимосвязанное рассмотрение этапов. Решение, принятое на каждом шаге, должно обязательно учиты вать последующее протекание процесса. Если этого не делать, а решать за дачу оптимизации на каждом этапе изолированно, исходя из получения максимума критерия оптимальности только на этапе, то решение всей за дачи оптимальным, как правило, не будет. Такая “близорукая” стратегия, в применении к предыдущему примеру, означала бы, что все средства вкла дываются в реконструкцию в первый же год.
Рис. 5.1. Схема метода динамического программирования
Проще всего начать решение задачи с оптимизации последнего, «-го, этапа, поскольку последующие этапы, которые следовало бы учиты вать при его оптимизации, отсутствуют. Вследствие этого в качестве кри терия здесь можно взять максимум целевой функции, или, как говорят, выигрыша, на данном шаге. Однако для решения этой задачи надо знать, чем закончился предыдущий (« - 1)-й шаг. Приходится делать об этом раз личные предположения и для каждого из них решать задачу. Каждое из полученных решений называется условным оптимальным управлением на «-м шаге, а соответствующее значение целевой функции - условным оп
тимальным выигрышем.
Схематически этот процесс иллюстрируется на рис. 5.1. Состоянию системы после окончания последнего, «-го, шага соответствует точка Z. Предыдущий (п - 1 )-й шаг может завершиться в одном из состояний Yu Уъ 73,... Для каждого из них, рассматриваемых как исходные по отношению к «-му шагу, решается задача оптимизации, и отыскивается условное опти мальное управление. Обозначим его й ^ - для состояния Y\\ _ для Y2 и
т. д. На рисунке штриховые линии, соединяющие точки Yi и Z, соответст вуют некоторым допустимым, а сплошные - оптимальным управлениям. Затем выполняется условная оптимизация предыдущего (« - 1)-го шага. Для каждого из возможных состояний системы после его завершения (точ ки , Y2, ...) рассматриваются ее начальные состояния.
Например, для точки Yx выделены две точки, соответствующие со
стоянию системы в начале (« - 1)-го шага: Х х и Х 2. Для каждой из них отыскивается условное оптимальное управление, переводящее систему в
следующее состояние. Обозначим его й^ - для точки Х х; - для точ
ки Х 2 и т. д. Критерием оптимальности здесь является требование, чтобы
выигрыш на данном (« - 1)-м шаге в сумме с условным оптимальным вы игрышем, полученным на последнем шаге, оказался максимальным. В ре зультате для каждого возможного состояния системы в начале (« - 1)-го шага стали известными оптимальные управления на двух оставшихся ша
гах. Для точки Х 3, например, это й^3\ на (« - 1)-м и й^2) на «-м шаге.
Следующая стадия - рассмотрение (« - 2)-го шага. Аналогично (« - 1)-му шагу, условное оптимальное управление здесь должно обратить в максимум суммы выигрыша на этом шаге и условного оптимального вы игрыша на всех оставшихся шагах: (« - 1)-м и «-м. Такой принцип выбора условного оптимального управления называется принципом оптималь ности. Он требует, по существу, чтобы управление, выбранное на каждом шаге, гарантировало оптимальное продолжение процесса, начиная с дан ного состояния.
Продолжение описанной процедуры в ее движении от конца к нача лу в конечном счете приведет в известное нам начальное состояние про цесса (точка Л на рис. 5.1). При этом в выражение для критерия оптималь ности на первом шаге войдет выигрыш, полученный на этом шаге, и опти мальный выигрыш на всех оставшихся шагах. Поэтому оптимальное управление, найденное здесь, является уже безусловным. Воспользовав шись им, мы узнаем, в какое состояние оно переводит систему по за вершении первого шага; например, точка В\ на рис. 5.1. Для этого состоя ния нам уже известно оптимальное управление на втором шаге и т. д. Та ким образом, на завершающей стадии процесс просматривают от начала к концу и выделяют на каждом шаге уже действительные, а не условные оп тимальные управления. Совокупность их будет решением задачи.
5.1.2. Задача о выборе кратчайшего маршрута
Имеется некоторое число пунктов на местности, связанных сетью дорог (рис. 5.2). Требуется найти кратчайший путь по этим дорогам из на чального пункта А в конечный пункт М. На рис. 5.2 имеющиеся дороги обозначены отрезками прямых, числа над ними - это расстояния между пунктами.
Рис. 5.2. Задача о выборе кратчайшего маршрута