pizhurin_a_a_pizhurin_a_a_modelirovanie_i_optimizaciya_proce
.pdfски состояние объекта можно рассматривать как точку х в «-мерном про странстве этих переменных. Ее координаты: х = {х ]ух2,...,х п). Такое про
странство называется фазовым. При п = 2 имеем фазовую плоскость
(рис. 5.5).
2. Движение объекта, т. е. изменение фазовых координат происхо дит не самопроизвольно: объектом можно управлять, т. е. воздействовать на изменение фазовых переменных с помощью группы управляющих воздействий щ, и2,..., иг , являющихся, как и фазовые переменные, функ циями времени. Значения этих параметров можно с течением времени ме нять по своему желанию. Для наглядности можно считать, что объект снабжен “рулями”, положения которых в каждый момент времени харак теризуются числами щ ,и2,...,и г . Совокупность параметров управления образует вектор управления й = (щ, и2,..., иг).
Рис. 5.5. Фазовая |
Рис. 5.6. Различные траектории |
плоскость |
в фазовой плоскости |
3.Функционирование объекта во времени описывается системой дифференциальных уравнений, обыкновенных или в частных производ ных.
4.Требуется перевести систему из одного состояния в другое. При этом среди множества способов перевода системы из начального состоя ния хн в конечное состояние хк (рис. 5.6) необходимо выбрать единствен
ный наилучший. Данная задача, следовательно, является задачей оптими зации.
5. Значения фазовых переменных для каждого момента времени од нозначно определяются начальным состоянием системы и значениями па раметров управления. В выборе этих значений в функции времени и со стоит задача оптимального управления.
6.В качестве критерия оптимальности выбирают некоторую функ цию, зависящую от координат состояния и управляющих воздействий, ко торые, в свою очередь, являются функциями времени. (Зависимость между некоторым параметром и одной или несколькими функциями называется функционалом.) Как и в рассмотренных выше задачах оптимизации, в ка честве критерия оптимальности могут быть выбраны различные техниче ские или экономические показатели процесса. Критерий оптимальности часто имеет вид определенного интеграла от фазовых координат и управ ляющих воздействий. В отличие от всех рассмотренных выше оптимиза ционных задач, оптимальное решение здесь - это не число и не совокуп ность чисел, а некоторая функция - траектория в пространстве фазовых ко ординат.
7.По условиям задачи значения всех переменных, т. е. фазовых ко ординат и управляющих воздействий, ограничены. Во многих случаях оп тимальное решение как раз и достигается на границе области допустимых значений для управляющих воздействий.
5.4.2.Математическая постановка задачи оптимального
управления. Принцип максимума
Объект управления описывается системой п дифференциальных уравнений
= f i{ x i>x2 ,---yxn;ul,...,u r'j, |
i = \,...,n , |
(5.53) |
||
a t |
|
|
|
|
где x ]9xl9...9xn - фазовые переменные; |
г/,,..., иг - |
управляющие воздейст |
||
вия. И те и другие являются функциями времени: *, = *,(/), |
Uj=Uj(t). |
|||
Введем вектор координат х |
хп) |
и вектор управляющих воздейст |
вий w=(w,,..., wr), называемый управлением. Управляющие воздействия принадлежат ограниченной области Q: w (/)eQ . Будем считать, что век тор й = (и 19 и2,..., иг) может находиться не только внутри области £1, но и
на ее границе. Такая область называется замкнутой.
Предположим далее, что имеется техническая возможность мгно венно изменять положения органов управления. Следовательно, значения управляющих воздействий Uj(t) могут меняться скачком. В соответствии
с этим будем рассматривать не только непрерывные управления й (/), но и управления, состоящие из конечного числа непрерывных кусков (рис. 5.7). Такие управления называются кусочно-непрерывными.
203
Рис. 5.7. Кусочно-непрерывное управление
Фазовые координаты принадлежат ограниченной и открытой облас ти S. Даны начальное (при t = 0) и конечное (при t =Т) значения вектора фазовых координат: х (о )= х н ={х1№,х 2н,...,х пи) и х (Т )= хх =(я:1к,...,х ж),
где Т - время процесса. Критерием оптимальности является достижение экстремума функционала
т
J= \fo {x ,u )d t.
0
Требуется из класса кусочно-непрерывных управлений выбрать такие w (/)eQ , чтобы при переходе из начальной точки Зсн в конечную Зск функционал J достигал экстремума (возможны различные варианты постановки этой задачи, когда начальная и конечная точки, а также вре мя Т не фиксированы).
Решение поставленной задачи основано на принципе максимума Понтрягина. Рассмотрим его для важного частного случая, когда реша ется задача о предельном быстродействии. Здесь требуется найти такое управление, при котором время перехода системы из начального состоя ния в конечное должно быть минимально. Соответствующий этому слу-
т
чаю функционал J можно записать в виде J - jd t, причем время Т не
о
фиксировано.
Сущность принципа максимума для решения этой задачи состо ит в следующем. Для управляемого объекта, описываемого системой уравнений (5.53), вводятся дополнительно функции времени Ц /^), \|/2 \|/„(0 и составляется новая функция Я вида
# =Vi (*)/i (*.«)+V2(')Л (*>«)+••• + (О/* f r «) • (5-54)
204
С помощью функции Н записывается следующая система диффе ренциальных уравнений для вспомогательных функций \|/j (/), \|/2 (/)>•••>
|
d t y i / d t = -d H /d x n / = 1,2,..„и . |
(5.55) |
||
Для отыскания оптимального управления u(t) и соответствующей |
||||
траектории 3c(f) необходимо: |
|
|
|
|
1) |
найти ненулевую |
совокупность |
функций у ^ ) ,..., |
\|/„(/)> |
удовлетворяющих системе (5.55); |
|
|
||
2) чтобы функция # = |
п |
достигала максимума по й |
||
М/1 (*> й) |
||||
при каждом значении 0 < t < T \ |
i=i |
|
|
|
|
|
|
||
3) |
чтобы при t = Т выполнялось условие шах Я (\|/(7,),Зс(г))>0. |
|||
Оказывается, что при выполнении условий 1 и 2 функция m axi/ (t) |
посто- |
|||
|
|
|
ие Q |
|
янна, так что достаточно проверить справедливость условия 3 для любого момента времени 0 < t < Т .
5.4.3. Пример решения задачи оптимального управления
Обратимся к решению задачи оптимального управления фрезерно обрезным станком, сформулированной в п. 5.4.1. Рассмотрим систему (5.41), (5.42), описывающую данный объект, при следующих упрощающих предположениях: масса М равна 1; коэффициент вязкого трения Hs и сила трения в направляющих равны нулю. Управляющее воздействие F обозна чим через w, а его максимальное значение через итах. Тогда уравнения дви жения объекта (5.41).. .(5.43) примут следующий вид:
dx xl dt = x2\ |
d x 2/ dt = u\ |
(5.56) |
“ “ max ^ “ ( 0 |
^ “ m a x ' |
( 5 -5 7 ) |
Требуется решить задачу о предельном быстродействии: переходе |
||
системы из начального состояния (*i(0) = *,H;x2(0) = *2н = 0) |
в конечное |
|
состояние ( хх(Т) = хХк; х2( Т) = х2к = 0). |
Это означает, что система из за |
данного начального положения хХн с нулевой начальной скоростью (х2н) должна за минимальное время перейти в заданное положение хХк и остано виться там (*2к=0)-
Функция Н в данном случае имеет вид
Н = \\fxx2 + \|?2и |
(5.58) |
в соответствии с уравнениями (5.54) и (5.53). Согласно уравнению (5.55) име ем следующую систему уравнений для вспомогательных функций \j/j и \|/2:
dvj/j/df = - дН / дхх=0; d\\f2/d t = - д Н / д х 2 = —\j/j .
Отсюда \j/j = сх; \|f2 =c2 - c xt, где Cj и с2 - постоянные интегрирования.
Функция Н равна Н = с хх2 +[ с 2 - c xt) и . С учетом ограничения (5.57)
найдем, при каких управляющих воздействиях u(t ) достигается максимум
функции Н. Из выражения (5.58) видно, |
что следует принять u(t) = umax |
||
П рИ У 2 ( * ) > ® И WM = _ и тах Щ 511 ^ 2 |
( 0 < 0 |
> Т 0 еС Т Ь |
|
“ (0= «max Sgn |
(0 = «шах Sgn (с2 - С, t). |
(5.59) |
Максимальное значение функции Я равно
тахЯ (?) = С!л:2 +итах(с2 - с 2 f)sgn(c2 - с,?).
Проверим выполнение условия 3-го принципа максимума. Как от мечалось, справедливость его достаточно проверить для любого момента времени 0 < t < T . Удобнее это сделать для t = 0:
max Я (0)= с1х2(0) + мтах с2sgnс2 = к тах| с21>0. ue Q
Условие 3, следовательно, выполняется.
Рис. 5.8. Оптимальный процесс при > 0 и с2 > 0
Таким образом, как видно из выражения (5.59), оптимальное управ ляющее воздействие в любой момент времени равно одному из двух своих предельных значений: +wmax или - wmax. Поскольку функция (c2 - c xt )
меняет знак не более одного раза, оптимальное управление состоит не бо лее чем из двух интервалов, на каждом из которых оно постоянно.
Значения констант сх и с2 определяются из граничных условий. На рис. 5.8 показан оптимальный процесс для случая, когда сх и с2 положи тельны.
207
Глава 6
ЭЛЕМЕНТЫ ТЕОРИИ МАССОВОГО ОБСЛУЖИВАНИЯ И УПРАВЛЕНИЯ ЗАПАСАМИ
6.1.Предмет теории массового обслуживания
Рассмотрим, что общего между следующими процессами: поток де талей поступает на станок в обработку; оператор анализирует качество до сок, проходящих по конвейеру; выходящие из строя узлы отправляют в ремонт; продавец обслуживает приходящих в магазин покупателей; лесо возные автомобили или суда разгружают в пунктах назначения.
Во всех перечисленных случаях мы имеем дело с широко понимае мым процессом обслуживания, в котором выделяются: 1) система массо вого обслуживания (СМО), выполняющая требуемые операции - это ста нок, на котором обрабатываются детали, продавец, обслуживающий поку пателей, оператор и т. д.; 2) объекты, нуждающиеся в услугах или в вы полнении работ. Они называются заявками или требованиями. В приведенных примерах это: детали, поступающие на обработку; доски, на правляемые на сортирование; покупатели; суда, ожидающие разгрузки, ит. д.
Почти всегда заявки поступают в СМО в случайные моменты вре мени. Если заявки поступают слишком часто, то им приходится ожидать обслуживания, т. е. возникает очередь, либо в других условиях они поки дают систему, оставаясь необслуженными. Если, напротив, заявки посту пают редко, то СМО значительное время простаивает. Методы теории мас сового обслуживания позволяют определить такие параметры, характери зующие эффективность функционирования СМО: среднее число заявок, которое может обслужить система за единицу времени; среднее время об служивания заявки в системе - в очереди и в ходе обслуживания; среднее число заявок в очереди; среднее относительное время простоя системы
идр. При этом предполагаются известными характеристики потока заявок
идлительности обслуживания. В конечном счете могут быть получены ре комендации в отношении оптимизации работы СМО путем, например, увеличения или уменьшения числа каналов обслуживания.
6.2. Системы массового обслуживания с неограниченной очередью
Рассмотрим задачу о загрузке оператора, для решения которой ис пользуются методы теории массового обслуживания. Пусть детали, изго тавливаемые одновременно на нескольких фрезерных станках, поступают к оператору, который сортирует их по качеству. Нас будут интересовать
параметры, характеризующие эффективность работы этой СМО. Прежде всего следует определить характеристики потока заявок, поступающих в систему; в данном случае - сортируемых деталей.
Предположим, что справедливы три допущения, существенно уп рощающие задачу:
1) статистический закон поступления заявок в систему одинаков в любые периоды времени; например, в начале и в конце рабочего дня, в разные дни недели. Поток заявок, для которого это условие справедливо,
называется стационарным;
2)в систему никогда не поступают одновременно два или более требований - условие ординарности потока заявок;
3)заявки прибывают в систему независимо друг от друга - условие отсутствия последействия. Это условие для рассматриваемого нами объ екта не будет выполняться, если, например, детали изготавливаются по следовательно на одном и том же оборудовании и сразу же поступают на сортирование. Тогда интервал времени между любыми двумя деталями, поступающими на сортирование, не может быть меньше, чем минимальное время обработки изделия, и, следовательно, имеет место упомянутое по следействие. Если, однако, минимальный интервал между заявками значи тельно меньше среднего интервала между их поступлениями, то последей ствием иногда можно пренебречь.
Пусть собраны статистические данные, обработка которых позво лила рассчитать среднее число заявок, поступающих в систему за единицу времени. Эта величина называется интенсивностью потока заявок и обозначается через X. В нашем примере X - это среднее число деталей, по ступающих на сортирование за одну минуту. Предположим, что эта вели чина равна 4.
Поток заявок, обладающий тремя перечисленными выше свойства ми - стационарности, ординарности и отсутствием последействия, - назы вается простейшим, или пуассоновским. В теории вероятности доказано, что для такого потока можно рассчитать вероятность того, что за время t в систему придет п заявок, по формуле
Это статистическое распределение называется распределением
Пуассона с параметром Xt.
Теперь надо установить закон продолжительности обслуживания; в данном случае - затрат времени на сортирование деталей. Будем считать, что для времени Т обслуживания одной заявки, являющегося случайной величиной, справедливы все те же условия стационарности, ординарности и отсутствия последействия, что и для потока заявок, поступающих в сис тему. Тогда можно доказать, что эта случайная величина имеет так назы ваемое показательное распределение. Это означает, что вероятность того,
что время Т обслуживания одной заявки примет значение, меньшее, чем /,
равна 1 - е_ц/. Величина ц, входящая в эту формулу, представляет собой среднее число заявок, которое обслуживает система за единицу времени, будучи все время занятой. По аналогии с X, она называется интенсивно стью потока обслуживания. Обратная величина - это среднее время об служивания одной заявки = 1 / ц .
Предположим, что в нашем случае среднее число деталей, которые оператор успевает рассортировать за 1 мин, равно ц = 5. Соотношение Х< ц, которое в данном случае имеет место, является необходимым для то го, чтобы в системе установился стационарный режим, характери зующийся постоянством статистических характеристик работы системы. Противоположное неравенство X> \i означало бы, что система не справля ется с обслуживанием заявок. В этом случае очередь заявок, ожидающих обслуживания, теоретически возрастала бы до бесконечности. При X = ц стационарный режим будет наблюдаться, только если поток заявок регу лярный, т. е. они появляются на входе системы через строго одинаковые промежутки времени, а продолжительность обслуживания - тоже детер минированная величина, в точности равная интервалу времени между при ходом соседних заявок. В дальнейшем нам понадобится величина р = Л/|х,
называемая приведенной интенсивностью потока заявок. В примере она равна р = 4/5 = 0,8.
Рассматриваемая нами система обслуживания относится к однока нальным СМО с неограниченной очередью. Для нее, а также для всех СМО, о которых пойдет речь ниже, будем полагать, что поток заявок явля ется простейшим, а время обслуживания распределено по показательному закону. Единственным каналом обслуживания в приведенном примере яв ляется оператор, занятый сортированием. Слова «неограниченная очередь» означают, что ни на число заявок в очереди, ни на время ожидания не на ложено никаких ограничений. В результате этого каждая заявка рано или поздно будет обслужена, а среднее число заявок А, обслуживаемых данной системой в единицу времени при стационарном режиме ее работы, равно интенсивности потока заявок: А =Х.
В теории массового обслуживания для такой СМО выведены сле дующие формулы. Вероятность р 0 того, что в СМО нет ни одной заявки,
то есть что канал обслуживания свободен, равна
p 0 = i - p . |
(6.1) |
Среднее число Lc заявок в системе равно
1 ,= р /(1 -р ). (6.2)
Средняя длительность пребывания заявки в системе Wcравна
210
|
(6.3) |
Z04=p2/( l- p ) . |
(6.4) |
|
(6.5) |
Формулы (6.1), (6.2) и (6.4) верны только для рассматриваемого здесь типа СМО - одноканальной, с неограниченной очередью, пуассоновским потоком заявок и с временем обслуживания, имеющим показательное распределение. В отличие от них, формулы (6.3) и (6.5) являются универ сальными. Они справедливы для СМО любого типа, с произвольным ха рактером потока заявок, любым распределением длительности обслужи вания, ограниченной или неограниченной очередью.
Воспользуемся приведенными выше формулами для получения ха рактеристик процесса сортирования деталей в рассматриваемой задаче о загрузке оператора. Для него имеем р 0 = 1 - р = 1 - 0,8 = 0,2. Это означает,
что 20 % рабочего времени оператор простаивает. Согласно формулам (6.2) и (6.3) Lc = 0,8/(l - 0,8) = 4; Wc= 4/4 = 1, то есть в среднем суммарное число деталей, находящихся в очереди и подвергающихся сортированию, равно 4, а время, затрачиваемое на сортирование вместе с его ожиданием, для одной детали равно 1 мин. Среднее число деталей, ожидающих сортирова ния (длина очереди), согласно (6.4) равно L0H= 0,82/(l-0,8) = 3,2. Среднее время пребывания детали в очереди составит согласно (6.5) W0ч = 3,2/4 = = 0,8 мин.
Предположим теперь, что пребывание деталей в очереди влечет за собой определенные издержки, в связи с чем возникает вопрос об увеличе нии числа операторов. Оплата их труда и проведение мероприятий, вы званных перестройкой процесса сортирования, также связаны с затратами. Поэтому можно говорить об оптимизационной задаче определения рацио нального числа операторов, исходя из минимума суммарных затрат. Сор тирование деталей, выполняемое несколькими параллельно работающими операторами, рассматривается как процесс работы многоканальной СМО,
Приведем основные формулы для «-канальной СМО с неограни ченной очередью и одинаковой интенсивностью обслуживания по всем ка налам. Условием стационарного режима в ней служит неравенство р/« < 1. Предположим, что оно выполнено.
Вероятность р 0 того, что в СМО нет ни одной заявки, равна |
|
р 0 = (l + р/ 1!+ р2 / 2! + ... + р"/и! + р"+1 /п \(п - р))-1. |
(6.6) |