Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metods / Управление в системах.pdf
Скачиваний:
112
Добавлен:
26.03.2015
Размер:
676.4 Кб
Скачать
n+r-

F1

æ

.

ö

æ

.

ö

m

çX ,X ,t÷

= FçX ,X ,t÷

+ å

 

è

 

ø

è

 

ø

j=1

 

 

 

 

 

 

 

æ

.

ö

(22.15)

y j (t)g j çX ,X ,t÷ ,

è

 

ø

 

где ψj(t) - произвольные функции времени.

3.Если в задаче одновременно присутствуют уравнения связи вида (17.12)

и(17.14), функция F1 вводится в форме:

F1

æ

.

ö

æ

.

ö

m

æ

.

ö

k

æ

.

ö

çX ,X ,t÷

= FçX ,X ,t÷

+ åy j (t)g j çX ,X ,t÷

+ ål jG j çX ,X ,t÷ .

 

è

 

ø

è

 

ø

j=1

è

 

ø

j=1

è

 

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

Для нахождения экстремума функционала (22.1) при наличии ограниче- ний вида (22.12) или (22.14) к функции F1 применяются условия (22.2) - (22.10) в зависимости от других условий задачи.

Лекция 23. Синтез линейного регулятора, оптимального по квадратичному критерию

Рассматривается линейная модель объекта управления:

dX (t)

= AX + BU ,

(23.1)

dt

 

 

где X(t)=(x1,x2,...xn) - n-мерный вектор состояния, U(t)={u1, u2,... ur} - r-

мерный вектор управления, A - матрица размерностью n × n, B - матрица раз- мерностью n × r .

Требуется построить линейный регулятор, решающий задачу стабилиза- ции объекта управления, причем должна обеспечиваться оптимальность по

квадратичному критерию качества:

 

 

 

 

æ

n

r

ö

 

ç

2

2

÷

(23.2)

J(X ,U ) = òç

å pi xi

+ åq ju j

÷ dt ,

0 è i=1

j=1

ø

 

где qi ³ 0 , rj>0 - весовые коэффициенты.

xi(0)=xi0, i=1,2,...,n;

Граничные условия фиксированные:

x1(¥) = x 2 (¥) =...= x n (¥) = 0 .

 

Оптимальное управление будем искать в виде функции переменных со- стояния системы: U=RX, где R - матрица размерностью r × n. Задача сводит- ся к определению элементов матрицы R, которые и являются коэффициентами регулятора.

Сформулированная задача соответствует задаче Лагранжа, рассмотрен- ной в предыдущей лекции, если считать все xi и uj составляющими мерной векторной функции - экстремали, причем для xi концы закреплены, для

85

uj - подвижны, а уравнения (23.1) дают n дифференциальных связей в форме

(22.14).

Составим функцию Лагранжа:

F1

æ

.

ö

n

r

n

æ .

n

r

ö

çX ,X ,t÷

= å pi x i2

+ åqj u2j + åyi (t)ç x i - åaik x k - åbilul ÷ .

 

è

 

ø

i=1

j=1

i=1

è

k =1

l=1

ø

Система уравнений Эйлера-Лагранжа:

F1 x i

F1 uj

 

d

æ

 

F

ö

 

-

 

ç

1

÷

= 0

dt

ç

.

÷

 

 

è

 

x i

ø

 

 

 

æ

 

F

ö

 

 

d ç

 

÷

 

-

 

 

ç

 

1

 

÷

= 0

 

 

.

 

 

dt ç

÷

 

 

 

è

 

u j ø

 

,

,

i=1,2,...n ;

j=1,2,...r .

(23.3)

(18.4)

В результате уравнения объекта (23.1) и получаемые после подстановки F1 в (23.3), (23.4) уравнения образуют систему уравнений:

.

n

r

 

x i

= åaik x k + åbilul ,

i=1,2,...n ;

 

k =1

l=1

 

 

n

.

 

2 pi x i - åaik y k

- yi = 0 , i=1,2,...n ;

 

k =1

 

 

 

n

 

 

2qjuj - åbkj y k = 0 ,

j=1,2,...r.

 

k =1

 

 

Получена система 2n+r дифференциальных и алгебраических уравнений

для определения 2n+r неизвестных функций xi, yi, uj, соответствующих оп- тимальному процессу. Порядок этой системы уравнений можно сразу понизить, выразив из последней группы уравнений составляющие управления и подста- вив их в уравнения объекта:

 

 

 

n

 

b

 

 

 

 

 

 

 

uj = å

kj

 

y k

, j=1,2,...r ;

 

 

 

 

 

.

 

 

k =12qj

 

 

 

 

 

n

r

æ

 

 

n

b

ö

n

n

x i = åaik x k + å

ççbilul

+ å

kj

y k ÷÷

=åaik x k + ådik x k ,

2qj

 

k =1

l=1

è

 

k =1

ø

k =1

k =1

 

 

 

 

n

b b

 

 

 

 

 

dik = å

il kl

,

i=1,2,...n ;

 

 

 

2q

 

 

 

 

k =1

 

 

l

 

 

 

86

. n

ψi = 2 pi x i åaik ψ k , i=1,2,...n . k =1

Полученной системе 2n линейных дифференциальных уравнений перво- го порядка соответствует характеристическое уравнение порядка 2n. Каждая функция x или ψ, являющаяся решением такой системы уравнений, имеет вид

суммы 2n экспонент вида Ck eμkt , где μk - корни характеристического уравне- ния. Известно, что у получаемого в рассматриваемй задаче характеристическо- го уравнения n корней лежат в левой полуплоскости, остальные n корней - в правой. С учетом заданных граничных условий для t → ∞ нетрудно показать, что для правых корней коэффициенты Ci в выражениях для функций x должны быть равны нулю. В результате выражения для переменных состояния системы в оптимальном процессе могут рассматриваться в виде:

n

xi (t) = åCik eμkt , i=1,2,...n,

k =1

где μk - левые корни характеристического уравнения. n

Оптимальное управление в форме uj = årij xi может быть теперь оп-

i=1

ределено путем алгебраических преобразований. Рассмотрим один из возмож- ных способов, ограничившись случаем одномерного управления (r=1). Пред- положим, что переменные состояния системы для модели (23.1) выбраны так, что:

.

.

.

x 2 = x 1,

x3 = x 2 , ..., xn = x n1,

а управляющий сигнал входит только в последнее уравнение:

.

n

 

x n

= åank xk + bu.

(23.5)

Тогда приняв

k =1

 

n

 

 

 

x1(t) = åCk eμkt ,

 

можно получить:

k =1

 

 

 

n

 

 

x i (t) = åμ ki1Ck eμk t , i=1,2,...n.

(23.6)

k =1

Введем новые переменные zk = C k eμk t . На основе (23.6) для них полу-

чим систему уравнений:

z1 + z2 +...+zn = x1,

87

μ1z1 + μ2 z2 +...nzn = x2,

(23.7)

...

 

m1n1z1 + m2n1z2 +...+mnn1zn = xn.

 

Решение (18.7) может быть получено в виде:

 

n

 

zk = åeki xi , k=1,2,...n,

(23.8)

i=1

где значения коэффициентов eki полностью определяются значениями mk, то есть соответствуют оптимальному процессу.

На основе (18.5), (18.8) получим:

 

1

æ .

n

ö

 

1

æ

n

n

ö

 

u =

 

 

çx n - åank xk ÷

=

 

 

ç

åmknC k eμk t - åank xk ÷

=

b

b

 

è

k =1

ø

 

èk =1

k =1

ø

 

 

1

æ

n

n

ö

 

1

æ

n n

n

ö

 

=

 

 

ç

åmkn zk

- åank xk ÷

=

 

 

ç

ååmkn eki xi - åank xk ÷

. (23.9)

b

b

 

è k =1

k =1

ø

 

èk =1i=1

k =1

ø

 

Впервой сумме все коэффициенты зависят только от корней характери- стического уравнения, соответствующего оптимальному процессу в системе. Во второй - от параметров объекта управления. После подстановки в (23.9) численных значений будут определены коэффициенты оптимального линейно- го регулятора.

Взаключение отметим, что по виду критерия качества (23.2) с учетом знака весовых коэффициентов ясно, что достигаемый для него экстремум мо- жет быть только минимумом.

Лекция 24. Каноническая форма уравнений Эйлера. Принцип максимума

Для задач оптимизации динамических систем, в частности, систем управ- ления, применяется особая форма записи уравнений для определения допусти- мых экстремалей - с использованием функции Гамильтона. Эта форма получи- ла наиболее широкое распространение для задач с дифференциальными связя- ми. Она принята за основу в методах оптимизации систем при наличии ограни- чений в форме неравенств.

Рассмотрим задачу синтеза оптимального управления для объекта, мо- дель которого задана в виде (21.1). Такая задача может рассматриваться как

задача Лагранжа, причем модель объекта дает n дифференциальных связей:

. .

æ

ö

= x i - fi (X ,U) = 0 ,

i=1,2,...n ,

 

gi ç X ,X ,U÷

(24.1)

è

ø

 

 

 

а критерий качества приводится к виду функционала:

88

 

t1

 

 

J(X ,U ) = ò F(X ,U)dt ® min.

 

(24.2)

 

t0

 

 

При решении задачи Лагранжа составляется функция Лагранжа:

 

n

n

æ .

ö

F1(X ,U) = F(X ,U) + åy i (t)gi (X ,U) = F(X ,U) + åy i (t)ç x i - fi (X ,U)÷ ,

i=1

i=1

è

ø

 

 

для которой далее составляется система уравнений Эйлера-Лагранжа и приме- няются другие условия достижения экстремума.

Если дифференциальные связи могут быть записаны в форме (21.1) или (19.1), может быть введена функция Гамильтона:

n

.

n

H (X ,U) = -F(X ,U) + åy i (t)x i = -F(X ,U) + åy i (t) fi (X ,U), (24.3)

i=1

 

i=1

связанная с функцией Лагранжа следующими соотношениями:

n

.

 

n

.

 

F1 = -H + åy i x i

или F1 = -H + åy i x i .

(24.4)

i=1

 

 

i=1

 

 

Функции ψi(t) называются сопряженными переменными. Они могут быть

определены по функции Гамильтона на основе (24.3):

 

 

yi =

H

 

, i=1,2,...n .

 

(24.5)

.

 

 

 

x i

 

 

 

 

Запишем уравнения Эйлера-Лагранжа, учитывая (24.4):

æç-H x i è

æç-H uj è

n

. ö

 

 

d

é

 

 

 

 

ê

 

 

+ åy i x i ÷

-

 

 

ê

 

dt

.

i=1

ø

 

 

ê¶ x

i

 

 

 

 

 

ë

 

 

n

. ö

 

 

 

é

 

 

 

 

d ê

 

+ åy i x i ÷

-

 

 

 

 

 

 

 

 

 

 

dt ê .

i=1

ø

 

 

 

 

 

 

ê

uj

 

 

 

 

 

ë

æ

n

. ö

ù

 

 

ç-H + åy i x i ÷

ú

= 0 ,

i=1,2,...n ;

ú

è

i=1

ø

ú

 

 

 

 

 

û

 

 

æ

 

 

ù

 

 

n

. öú

 

 

ç

-H + åy i x i ÷ú = 0 ,

j=1,2,...r.

è

i=1

øú

 

 

 

 

 

û

 

 

Раскрыв скобки и продифференцировав, получим:

.

H

 

 

 

y i = -

,

i=1,2,...n ;

(24.6)

 

 

x i

 

 

H = 0 ,

j=1,2,...r .

(24.7)

uj

 

 

 

 

Полученная система уравнений (24.5) - (24.7) называется системой урав- нений Эйлера-Лагранжа в канонической форме.

Рассмотрим условия трансверсальности.

89

Для подвижных концов на основе (22.8) с учетом (24.4) получим:

F1

 

= y i (t0 ) = 0 или

F1

 

= y i (t1 ) = 0 . (24.8)

.

 

 

.

 

 

x i

t = t0

 

x i

t = t1

 

Для свободных концов на основе (22.9) с учетом (24.4), (24.8):

é

n F

ê

 

1

êF1

- å .

ë

i=1x i

. ù x i úú

ût=t0

é

n

.

n

æ

n

= ê-H + åy i

x i -

å

 

ç-H

+ å

.

ê

i=1

 

 

è

i=1

ë

 

i=1x i

= -H (t0 ) = 0

или

-H (t1 ) = 0 .

. ö .

ù

 

yi x i ÷ x i ú

=

ø

ú

 

 

ût=t

 

 

0

 

 

(24.9)

При работе с функцией Гамильтона вместо (24.8), (24.9) обычно приме- няется следующее общее выражение для условий трансверсальности:

é

ê- êë

Hdt +

n

y

dx

ù

å

ú

 

i

i

ú

 

i=1

 

û

t=t1

= 0 .

(24.10)

t=t0

Рассмотренная система необходимых и достаточных условий достижения экстремума функционала, полученная в рамках вариационного исчисления, обеспечивает получение локальных экстремумов. Этого вполне достаточно в

задачах без ограничений на переменные состояния объекта управления или на управляющие сигналы. Если область допустимых управлений не ограничена, абсолютный экстремум совпадает с локальным. Если в задаче рассматривается некоторая ограниченная область допустимых состояний или управлений, зада- чу оптимизации нельзя свести к определению локального экстремума. Абсо- лютный экстремум в ряде случаев может совпадать с границей допустимой об- ласти.

Для задач с ограничениями используются специальные методы оптими- зации, наиболее известными из которых являются принцип максимума Понтря- гина и динамическое программирование Беллмана. Наиболее удобен для реше- ния практических задач в силу своей простоты принцип максимума. Рассмот- рим этот метод для задач с ограничением на управление.

Основная формулировка принципа максимума соответствует задаче обеспечения минимума функционала путем выбора оптимального управления в

пределах некоторой области допустимых управлений: U(t) ÎC .

Для достижения минимума функционала (24.2) при заданных уравнениях объекта управления (24.1) необходимо достижение максимума функции Га-

мильтона по управлению

æ

^ ^

^ ö

 

æ

^

^ ö

(24.11)

H ç X ,U ,

= max H çX ,U ,

è

 

ø

U C

è

 

ø

 

90