- •СОДЕРЖАНИЕ
- •Лекция 1. Основные понятия теории автоматического управления, виды задач управления, фундаментальные принципы управления. Показатели качества управления. Базовый пример системы управления
- •Лекция 2. Передаточные функции и частотные характеристики динамических звеньев
- •Лекция 3. Структурно-динамическая схема системы. Типовые соединения динамических звеньев. Передаточные функции замкнутых систем
- •Лекция 4. Основные положения теории устойчивости. Алгебраические методы анализа устойчивости линейных систем управления
- •Лекция 5. Частотные методы анализа устойчивости систем управления
- •Лекция 6. Оценка точности систем управления. Понятия астатизма и инвариантности
- •Лекция 7. Назначение, принципы построения и основные особенности компьютерных систем управления
- •Лекция 9. Дискретные преобразования и их свойства
- •Лекция 10. Передаточные функции импульсных звеньев и систем
- •Лекция 11. Анализ устойчивости и качества импульсных систем
- •Лекция 12. Особенности построения математических моделей компьютерных систем управления. Методы линеаризации
- •Лекция 13. Передаточные функции компьютерных систем управления
- •Лекция 14. Синтез системы управления. Обеспечение точности системы
- •Лекция 15. Синтез системы управления. Обеспечение запаса устойчивости системы
- •Лекция 16. Синтез системы управления. Обеспечение запаса устойчивости системы (продолжение)
- •Лекция 17. Применение типовых ЛАХ при синтезе цифровых систем управления
- •Лекция 18. Непрерывные корректирующие звенья
- •Лекция 19. Синтез непрерывных корректирующих средств
- •Лекция 20. Синтез компьютерного управления
- •Лекция 21. Постановка задачи оптимального управления
- •Лекция 22. Синтез оптимального управления на основе вариационного исчисления
- •Лекция 23. Синтез линейного регулятора, оптимального по квадратичному критерию
- •Лекция 24. Каноническая форма уравнений Эйлера. Принцип максимума
- •Лекция 25. Синтез системы стабилизации, оптимальной по быстродействию
F1 |
æ |
. |
ö |
æ |
. |
ö |
m |
çX ,X ,t÷ |
= FçX ,X ,t÷ |
+ å |
|||||
|
è |
|
ø |
è |
|
ø |
j=1 |
|
|
|
|
|
|
|
æ |
. |
ö |
(22.15) |
y j (t)g j çX ,X ,t÷ , |
|||
è |
|
ø |
|
где ψj(t) - произвольные функции времени.
3.Если в задаче одновременно присутствуют уравнения связи вида (17.12)
и(17.14), функция F1 вводится в форме:
F1 |
æ |
. |
ö |
æ |
. |
ö |
m |
æ |
. |
ö |
k |
æ |
. |
ö |
çX ,X ,t÷ |
= FçX ,X ,t÷ |
+ åy j (t)g j çX ,X ,t÷ |
+ ål jG j çX ,X ,t÷ . |
|||||||||||
|
è |
|
ø |
è |
|
ø |
j=1 |
è |
|
ø |
j=1 |
è |
|
ø |
|
|
|
|
|
|
|
|
|
|
|
|
|
Для нахождения экстремума функционала (22.1) при наличии ограниче- ний вида (22.12) или (22.14) к функции F1 применяются условия (22.2) - (22.10) в зависимости от других условий задачи.
Лекция 23. Синтез линейного регулятора, оптимального по квадратичному критерию
Рассматривается линейная модель объекта управления:
dX (t) |
= AX + BU , |
(23.1) |
|
dt |
|||
|
|
где X(t)=(x1,x2,...xn) - n-мерный вектор состояния, U(t)={u1, u2,... ur} - r-
мерный вектор управления, A - матрица размерностью n × n, B - матрица раз- мерностью n × r .
Требуется построить линейный регулятор, решающий задачу стабилиза- ции объекта управления, причем должна обеспечиваться оптимальность по
квадратичному критерию качества: |
|
|
|
|
∞ æ |
n |
r |
ö |
|
ç |
2 |
2 |
÷ |
(23.2) |
J(X ,U ) = òç |
å pi xi |
+ åq ju j |
÷ dt , |
|
0 è i=1 |
j=1 |
ø |
|
где qi ³ 0 , rj>0 - весовые коэффициенты. |
xi(0)=xi0, i=1,2,...,n; |
Граничные условия фиксированные: |
|
x1(¥) = x 2 (¥) =...= x n (¥) = 0 . |
|
Оптимальное управление будем искать в виде функции переменных со- стояния системы: U=RX, где R - матрица размерностью r × n. Задача сводит- ся к определению элементов матрицы R, которые и являются коэффициентами регулятора.
Сформулированная задача соответствует задаче Лагранжа, рассмотрен- ной в предыдущей лекции, если считать все xi и uj составляющими мерной векторной функции - экстремали, причем для xi концы закреплены, для
85
uj - подвижны, а уравнения (23.1) дают n дифференциальных связей в форме
(22.14).
Составим функцию Лагранжа:
F1 |
æ |
. |
ö |
n |
r |
n |
æ . |
n |
r |
ö |
çX ,X ,t÷ |
= å pi x i2 |
+ åqj u2j + åyi (t)ç x i - åaik x k - åbilul ÷ . |
||||||||
|
è |
|
ø |
i=1 |
j=1 |
i=1 |
è |
k =1 |
l=1 |
ø |
Система уравнений Эйлера-Лагранжа:
¶F1 ¶x i
¶F1 ¶uj
|
d |
æ |
|
¶F |
ö |
|
||
- |
|
ç |
1 |
÷ |
= 0 |
|||
dt |
ç |
. |
÷ |
|||||
|
|
è |
|
¶ x i |
ø |
|
||
|
|
æ |
|
¶F |
ö |
|
||
|
d ç |
|
÷ |
|
||||
- |
|
|
ç |
|
1 |
|
÷ |
= 0 |
|
|
. |
|
|||||
|
dt ç |
÷ |
|
|||||
|
|
è |
|
¶u j ø |
|
,
,
i=1,2,...n ;
j=1,2,...r .
(23.3)
(18.4)
В результате уравнения объекта (23.1) и получаемые после подстановки F1 в (23.3), (23.4) уравнения образуют систему уравнений:
. |
n |
r |
|
x i |
= åaik x k + åbilul , |
i=1,2,...n ; |
|
|
k =1 |
l=1 |
|
|
n |
. |
|
2 pi x i - åaik y k |
- yi = 0 , i=1,2,...n ; |
||
|
k =1 |
|
|
|
n |
|
|
2qjuj - åbkj y k = 0 , |
j=1,2,...r. |
||
|
k =1 |
|
|
Получена система 2n+r дифференциальных и алгебраических уравнений |
для определения 2n+r неизвестных функций xi, yi, uj, соответствующих оп- тимальному процессу. Порядок этой системы уравнений можно сразу понизить, выразив из последней группы уравнений составляющие управления и подста- вив их в уравнения объекта:
|
|
|
n |
|
b |
|
|
|
|
|
|||
|
|
uj = å |
kj |
|
y k |
, j=1,2,...r ; |
|
||||||
|
|
|
|
||||||||||
. |
|
|
k =12qj |
|
|
|
|
|
|||||
n |
r |
æ |
|
|
n |
b |
ö |
n |
n |
||||
x i = åaik x k + å |
ççbilul |
+ å |
kj |
y k ÷÷ |
=åaik x k + ådik x k , |
||||||||
2qj |
|||||||||||||
|
k =1 |
l=1 |
è |
|
k =1 |
ø |
k =1 |
k =1 |
|||||
|
|
|
|
n |
b b |
|
|
|
|||||
|
|
dik = å |
il kl |
, |
i=1,2,...n ; |
|
|||||||
|
|
2q |
|
||||||||||
|
|
|
k =1 |
|
|
l |
|
|
|
86
. n
ψi = 2 pi x i − åaik ψ k , i=1,2,...n . k =1
Полученной системе 2n линейных дифференциальных уравнений перво- го порядка соответствует характеристическое уравнение порядка 2n. Каждая функция x или ψ, являющаяся решением такой системы уравнений, имеет вид
суммы 2n экспонент вида Ck eμkt , где μk - корни характеристического уравне- ния. Известно, что у получаемого в рассматриваемй задаче характеристическо- го уравнения n корней лежат в левой полуплоскости, остальные n корней - в правой. С учетом заданных граничных условий для t → ∞ нетрудно показать, что для правых корней коэффициенты Ci в выражениях для функций x должны быть равны нулю. В результате выражения для переменных состояния системы в оптимальном процессе могут рассматриваться в виде:
n
xi (t) = åCik eμkt , i=1,2,...n,
k =1
где μk - левые корни характеристического уравнения. n
Оптимальное управление в форме uj = årij xi может быть теперь оп-
i=1
ределено путем алгебраических преобразований. Рассмотрим один из возмож- ных способов, ограничившись случаем одномерного управления (r=1). Пред- положим, что переменные состояния системы для модели (23.1) выбраны так, что:
. |
. |
. |
x 2 = x 1, |
x3 = x 2 , ..., xn = x n−1, |
а управляющий сигнал входит только в последнее уравнение:
. |
n |
|
x n |
= åank xk + bu. |
(23.5) |
Тогда приняв |
k =1 |
|
n |
|
|
|
|
|
x1(t) = åCk eμkt , |
|
|
можно получить: |
k =1 |
|
|
|
|
n |
|
|
x i (t) = åμ ki−1Ck eμk t , i=1,2,...n. |
(23.6) |
k =1
Введем новые переменные zk = C k eμk t . На основе (23.6) для них полу-
чим систему уравнений:
z1 + z2 +...+zn = x1,
87
μ1z1 + μ2 z2 +...+μnzn = x2, |
(23.7) |
... |
|
m1n−1z1 + m2n−1z2 +...+mnn−1zn = xn. |
|
Решение (18.7) может быть получено в виде: |
|
n |
|
zk = åeki xi , k=1,2,...n, |
(23.8) |
i=1
где значения коэффициентов eki полностью определяются значениями mk, то есть соответствуют оптимальному процессу.
На основе (18.5), (18.8) получим:
|
1 |
æ . |
n |
ö |
|
1 |
æ |
n |
n |
ö |
|
|||
u = |
|
|
çx n - åank xk ÷ |
= |
|
|
ç |
åmknC k eμk t - åank xk ÷ |
= |
|||||
b |
b |
|||||||||||||
|
è |
k =1 |
ø |
|
èk =1 |
k =1 |
ø |
|
|
1 |
æ |
n |
n |
ö |
|
1 |
æ |
n n |
n |
ö |
|
|||
= |
|
|
ç |
åmkn zk |
- åank xk ÷ |
= |
|
|
ç |
ååmkn eki xi - åank xk ÷ |
. (23.9) |
||||
b |
b |
||||||||||||||
|
è k =1 |
k =1 |
ø |
|
èk =1i=1 |
k =1 |
ø |
|
Впервой сумме все коэффициенты зависят только от корней характери- стического уравнения, соответствующего оптимальному процессу в системе. Во второй - от параметров объекта управления. После подстановки в (23.9) численных значений будут определены коэффициенты оптимального линейно- го регулятора.
Взаключение отметим, что по виду критерия качества (23.2) с учетом знака весовых коэффициентов ясно, что достигаемый для него экстремум мо- жет быть только минимумом.
Лекция 24. Каноническая форма уравнений Эйлера. Принцип максимума
Для задач оптимизации динамических систем, в частности, систем управ- ления, применяется особая форма записи уравнений для определения допусти- мых экстремалей - с использованием функции Гамильтона. Эта форма получи- ла наиболее широкое распространение для задач с дифференциальными связя- ми. Она принята за основу в методах оптимизации систем при наличии ограни- чений в форме неравенств.
Рассмотрим задачу синтеза оптимального управления для объекта, мо- дель которого задана в виде (21.1). Такая задача может рассматриваться как
задача Лагранжа, причем модель объекта дает n дифференциальных связей:
. .
æ |
ö |
= x i - fi (X ,U) = 0 , |
i=1,2,...n , |
|
gi ç X ,X ,U÷ |
(24.1) |
|||
è |
ø |
|
|
|
а критерий качества приводится к виду функционала:
88
|
t1 |
|
|
J(X ,U ) = ò F(X ,U)dt ® min. |
|
(24.2) |
|
|
t0 |
|
|
При решении задачи Лагранжа составляется функция Лагранжа: |
|
||
n |
n |
æ . |
ö |
F1(X ,U) = F(X ,U) + åy i (t)gi (X ,U) = F(X ,U) + åy i (t)ç x i - fi (X ,U)÷ , |
|||
i=1 |
i=1 |
è |
ø |
|
|
для которой далее составляется система уравнений Эйлера-Лагранжа и приме- няются другие условия достижения экстремума.
Если дифференциальные связи могут быть записаны в форме (21.1) или (19.1), может быть введена функция Гамильтона:
n |
. |
n |
H (X ,U) = -F(X ,U) + åy i (t)x i = -F(X ,U) + åy i (t) fi (X ,U), (24.3) |
||
i=1 |
|
i=1 |
связанная с функцией Лагранжа следующими соотношениями:
n |
. |
|
n |
. |
|
F1 = -H + åy i x i |
или F1 = -H + åy i x i . |
(24.4) |
|||
i=1 |
|
|
i=1 |
|
|
Функции ψi(t) называются сопряженными переменными. Они могут быть |
|||||
определены по функции Гамильтона на основе (24.3): |
|
|
|||
yi = |
∂H |
|
, i=1,2,...n . |
|
(24.5) |
. |
|
|
|||
|
¶ x i |
|
|
|
|
Запишем уравнения Эйлера-Лагранжа, учитывая (24.4):
¶ æç-H ¶x i è
¶ æç-H ¶uj è
n |
. ö |
|
|
d |
é |
|
¶ |
|
|
|
|
ê |
|
|
|||||
+ åy i x i ÷ |
- |
|
|
ê |
|
||||
dt |
. |
||||||||
i=1 |
ø |
|
|
ê¶ x |
i |
||||
|
|
|
|
|
ë |
|
|
||
n |
. ö |
|
|
|
é |
|
|
||
|
|
d ê |
¶ |
|
|||||
+ åy i x i ÷ |
- |
|
|
||||||
|
|
|
|
|
|
|
|||
|
dt ê . |
||||||||
i=1 |
ø |
|
|
||||||
|
|
|
|
ê |
¶ uj |
||||
|
|
|
|
|
ë |
æ |
n |
. ö |
ù |
|
|
ç-H + åy i x i ÷ |
ú |
= 0 , |
i=1,2,...n ; |
||
ú |
|||||
è |
i=1 |
ø |
ú |
|
|
|
|
|
û |
|
|
æ |
|
|
ù |
|
|
n |
. öú |
|
|
||
ç |
-H + åy i x i ÷ú = 0 , |
j=1,2,...r. |
|||
è |
i=1 |
øú |
|
|
|
|
|
|
û |
|
|
Раскрыв скобки и продифференцировав, получим:
. |
¶H |
|
|
|
|
y i = - |
, |
i=1,2,...n ; |
(24.6) |
||
|
|||||
|
¶x i |
|
|
||
∂H = 0 , |
j=1,2,...r . |
(24.7) |
|||
¶uj |
|
|
|
|
Полученная система уравнений (24.5) - (24.7) называется системой урав- нений Эйлера-Лагранжа в канонической форме.
Рассмотрим условия трансверсальности.
89
Для подвижных концов на основе (22.8) с учетом (24.4) получим:
¶F1 |
|
= y i (t0 ) = 0 или |
¶F1 |
|
= y i (t1 ) = 0 . (24.8) |
||
. |
|
|
. |
|
|
||
¶ x i |
t = t0 |
|
¶ x i |
t = t1 |
|
Для свободных концов на основе (22.9) с учетом (24.4), (24.8):
é |
n ¶F |
|
ê |
|
1 |
êF1 |
- å . |
|
ë |
i=1¶ x i |
. ù x i úú
ût=t0
é |
n |
. |
n |
¶ |
æ |
n |
|
= ê-H + åy i |
x i - |
å |
|
ç-H |
+ å |
||
. |
|||||||
ê |
i=1 |
|
|
è |
i=1 |
||
ë |
|
i=1¶ x i |
|||||
= -H (t0 ) = 0 |
или |
-H (t1 ) = 0 . |
. ö . |
ù |
|
yi x i ÷ x i ú |
= |
|
ø |
ú |
|
|
ût=t |
|
|
|
0 |
|
|
(24.9) |
При работе с функцией Гамильтона вместо (24.8), (24.9) обычно приме- няется следующее общее выражение для условий трансверсальности:
é
ê- êë
Hdt + |
n |
y |
dx |
ù |
å |
ú |
|||
|
i |
i |
ú |
|
|
i=1 |
|
û |
t=t1
= 0 . |
(24.10) |
t=t0
Рассмотренная система необходимых и достаточных условий достижения экстремума функционала, полученная в рамках вариационного исчисления, обеспечивает получение локальных экстремумов. Этого вполне достаточно в
задачах без ограничений на переменные состояния объекта управления или на управляющие сигналы. Если область допустимых управлений не ограничена, абсолютный экстремум совпадает с локальным. Если в задаче рассматривается некоторая ограниченная область допустимых состояний или управлений, зада- чу оптимизации нельзя свести к определению локального экстремума. Абсо- лютный экстремум в ряде случаев может совпадать с границей допустимой об- ласти.
Для задач с ограничениями используются специальные методы оптими- зации, наиболее известными из которых являются принцип максимума Понтря- гина и динамическое программирование Беллмана. Наиболее удобен для реше- ния практических задач в силу своей простоты принцип максимума. Рассмот- рим этот метод для задач с ограничением на управление.
Основная формулировка принципа максимума соответствует задаче обеспечения минимума функционала путем выбора оптимального управления в
пределах некоторой области допустимых управлений: U(t) ÎC .
Для достижения минимума функционала (24.2) при заданных уравнениях объекта управления (24.1) необходимо достижение максимума функции Га-
мильтона по управлению
æ |
^ ^ |
^ ö |
|
æ |
^ |
^ ö |
(24.11) |
H ç X ,U ,Y÷ |
= max H çX ,U ,Y÷ |
||||||
è |
|
ø |
U C |
è |
|
ø |
|
90