- •1.1.2. Условия лежандра
- •1.1.5. Функционалы со многими неизвестными
- •1.1.9. Задачи нл условный экстремум
- •1.1.10. О решении задач оптимального управления вариационными методами
- •1.2. Метод динамического программирования
- •1.2.1. Принцип оптимальности
- •1.2.2. Одномерная дискретная задача и вычислительные аспекты метода
- •1.2.3. Метод динамического программирования в непрерывной задаче. Уравнение беллмана
- •1.3. Принцип максимума понтрягина
- •1.3.1. Игольчатая вариация и условия оптимальности
- •1.3.2. Система сопряженных уравнений
- •1.3.3. Обобщения. Обсуждение результатов
- •Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
- •Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления
- •Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления
- •Оптимальное управление автономными объектами
- •1.3.4. Вычислительные аспекты принципа максимума
1.3.4. Вычислительные аспекты принципа максимума
Рассмотренные примеры относятся к весьма узкому классу задач оптимизации, которые позволяют в аналитической форме получить решение. Подобные задачи являются скорее исключением, нежели правилом — большинство из них решается только численно на ЭВМ. Для повышения эффективности численных процедур поиска оптимальных решений разработаны определенные рекомендации, помогающие организовать рациональный процесс последовательного приближения к оптимальному решению. Рассмотрим одно из распространенных правил последовательного поиска оптимального управления (схема И. А. Крылова и Ф. JI. Черноусько). Для определенности будем ориентироваться на одномерную задачу с фиксированным временем управления и свободным правым концом траектории. Логика метода последовательных приближений основана на том, что выбирается некоторое допустимое управление и последовательно улучшается до тех пор, пока не окажется подходящих допустимых вариаций управления, уменьшающих критерий качества. Существо метода изложим в форме следующей последовательности операций:
-
В области допустимых управлений задаются некоторым допустимым управлением — диспетчерским. Для простоты можно положить если — допустимое управление.
-
Управление подставляют в уравнение объекта управления (1.75) и интегрируют последнее при начальных условиях (1.76). Соответствующее решение обозначим .
-
На процессах вычисляют критерий качества .
-
Составляют систему сопряженных уравнений (1.90). Входящие в эти уравнения функции заменяют на , затем сопряженную систему интегрируют справа налево от до при краевых условиях (1.81) (техника этой операции частично отражена в примере 1.11). Соответствующее решение обозначим символом .
-
В соответствии с (1.85) составляют выражение гамильтониана, в котором функции заменяют на результате получаем . Заметим, что управление не заменяется диспетчерским управлением .
-
Так как в составе гамильтониана неизвестным является только управление , решается задача поиска такого допустимого управления, на котором функция достигает наибольшего значения. При использовании ЭВМ все процессы можно проквантовать по времени и для каждого дискретного момента вычислить максимизирующее управление в соответствии с каким-либо алгоритмом поиска экстремума функции. Соответствующие алгоритмы излагаются в гл. 6. Обозначим полученное в результате управление символом .
-
Управление принимается за первое приближение к оптимальному управлению, и относительно него проводятся операции 2, 3. Результат операции 2 обозначим символом .
-
Если окажется , то проводятся операции 4—6, вследствие чего появляется второе приближение оптимального управления
-
Если окажется то первое приближение корректируется путем перехода к функции , где — эмпирически подбираемый коэффициент, обеспечивающий неравенство в составе которого является результатом операции 2 при управлении . Относительно проводятся последующие операции 4—6, вследствие чего появляется второе приближение .
-
С управлением проводятся все операции по схеме 2—9, что приводит к третьему приближению .
-
Вычисления продолжают до тех пор, пока не будет достигнуто условие , при котором управления на двух соседних циклах обращения к операциям 2-10 совпадают и характеризуются одним и тем же значением критерия качества. Это управление принимается за окончательное решение задачи .