Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление колебаниями

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
15.93 Mб
Скачать

§ 1] З А Д А Ч И С Ф И К С И Р О В А Н Н Ы М В Р Е М Е Н Е М щ

оптимального управления (3.1.2), (3.1.14), (3.1.15). Снача­ ла строится однопараметрическое семейство решений кра­ евой задачи (3.1.31) в виде (3.1.33), где р — параметр се­ мейства, принадлежащий окрестности точки Р = 0 , и се­ мейство функционалов (3.1.37), т. е. функция J0(p). Да­ лее определяется точка р° минимума функции / 0(р) из (3.1.38). Если при этом выполняются условия (3.1.42) пли (3.1.44), (3.1.45), то р° = 0.

Исходные фазовые и сопряженные переменные а, ф, р, q определяем соотношениями а = |, ф = <р, р = ц, <7 = 0 и (3.1.33), в которые подставляется Р = Р°. Полученное приближение к траектории будет по построению удов­ летворять краевым условиям (3.1.14) и условиям транс­ версальности (3.1.19) с погрешностью порядка е. Реали­ зующееся иа этой траектории значение функционала, рав­

ное /о = Jo (Р°). отличается па величину порядка е от точного минимума J* фушщионала (3.1.15).

Приближеппое оптимальное управление и* определено выражением (3.1.18), в которое нужно подставить р = ц, q = 0. Получим управление как функцию т, а, ф, а0. В формуле (3.1.18) можно полояшть а = £, однако быст­ рую переменную ф нельзя заменить на <р согласно (3.1.33) без потери точности (в отличие от главы 2 , где точность вычисления фазы ф была такой же, как и для медленных переменных). Получеппое управление будет зависеть от медленного времени т и фазы ф, а также от начального вектора а°.

Наконец, управление в форме синтеза (как функция т, а, ф) получается, если в выражении (3.1.33) для ц со­ вершить замену аргументов то т, а0-*■ а и подставить TJ в (3.1.18).

Построенное управление (для всех указанных вариан­ тов его функциональных зависимостей) будет приближен­ но оптимальным в следующем смысле. Если подставить его в исходную систему (3.1.2), то соответствующая тра­ ектория лежит в е-окрестности построенной приближен­ ной траектории, а значение функционала на Oie) отлича­ ется от его минимума J*.

Отметим, что решение усредненной краевой задачи (3.1.31) существенно проще исходной. Во-первых, система (3.1.31) для 1, л содержит 2п уравнений (вместо 2 /1 + 2). Во-вторых, в ней отсутствуют быстрые переменные, что

142 УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ |ГЛ. 3

позволило заменой времени т = е£ исключить параметр е п свести ее к решению на коротком интервале медленно­ го времени т е [ т 0) 0], О ~ 1, т0 = etQ. Кроме того, исполь­ зование первого интеграла (3.4.32) позволяет понизить порядок усредненной канонической системы (3.1.31) и в случае системы с одной степепыо свободы сводит ее ре­

шение к квадратуре.

 

динамическую систему с од­

8 .

Пример. Рассмотрим

ной степенью свободы (см. (3.1.12))

 

у = е[к + Ну) -%у], y(t0) = y°t

y(t0) = y°> 0. (3.1.46)

Здесь

у — обобщенная

координата, у =

cly/clt — ско­

рость, е ^ 0 — малый параметр;

EF — малая

потенциаль­

ная сила,

2 я-периодпческая

функция относительно у со

средним EF0; е / 5* 0 — коэффициент вязкого трения. Урав­ нением (3.1.46) описывается ряд модельных задач управ­ ляемого движения в слабых периодических нолях, быст­ рых вращений (см. (3.1.12)) п др. Уравнение (3.1.46) за­

меной у = -ф, у = а приводится к стапдартпой системе ви­

да

(3.1.2)

 

 

 

 

a =

e[u + F(ij)) -%а], ip = a, a(t0) = y°,

aj>(*o) =

У0. (3.1.47)

 

Поставим задачу оптимального управлеппя

 

 

 

т

 

 

 

 

а(Г) = у * > 0 ,

J = e \ u 4 t,

Г =

0е-1 : (3.1.48)

 

Здесь у*— заданное

значение скорости

у;

ограппче-

пия па и не налагаются. Обычным приемом интегральный функционал (3.1.47) приведем к форме (3.1.15).

Усреднеппая краевая задача (3.1.31) в принятых вы­ ше обозначениях приводится к виду ОХ — множитель Ла-

грапжа)

 

§ = 4 -ч + ^ - й - S W - Л

№ - v * ,

 

(3.1.49)

* = ХП - Р, Л (Э) = К Т = в*,

т0 = etQ.

§ 11

ЗАДАЧИ С ФИКСИРОВАННЫМ ВРЕМЕНЕМ

143

Решение этой линейной краевой задачи при р = О на­

ходится элементарно и равно

 

 

 

 

+ Т

+ 4 е_х(0_г)>

11(т ) =

^-x(e-T)t

Ь=

4х{у* — у°е~^е~ч) — ^

[ 1 -

е—z(0—T°>J} X

 

x

[ l - ^

e" t«)]"*1. □

(3.1.50)

Приближенные выражения для оптимального управлення и функционала (3.1.48) найдем в соответствии с из­ ложенной выше методикой при помощи решения (3.1.50). Получим

“ * = 4 'l W , Jo(°) “

т ^ I1

(3.1.51)

Покажем теперь, что

р = 0

доставляет

минимум

(3.1.38). Из линейности усредненной системы (3.1.49)

следует, что решение

ц краевой задачи 43.1.49) линей­

но зависит от параметра £

 

!(т,

р) = |о(т) +

P^I(T),

т|(т, р) = ло(т) + PTII(T),

(3.1.52)

 

 

 

Я ~ ЛоИрЯь

 

 

 

 

Подставляя и* нз (3.1.51) и 1] из (3.1.52) в функцио­

нал (3.1.48), получим

 

 

 

е

 

 

 

Л(Р) = 4 j

t'l”М+ 2К М 'llW + P2'iiMld x - (ЗЛ-53>

 

‘'о

 

 

 

 

Так как

цДт) Ф 0 , то

пз (3.1.53) следует, что экстре­

мум

(минимум)

(3.1.38)

существует и единствен. С дру­

гой

стороны, пз

общей

формулы (3.1.41) вытекает, что

Р =

0 есть точка экстремума функции /<Др). Следователь­

но,

р = 0 есть искомая

точка глобального минимума

/ 0(р), причем

 

 

Jв

(3.1.54)

ч

144

УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ

[ГЛ. 3

В справедливости (3.1.54) можно убедиться и непо­ средственной проверкой, решив краевую задачу (3.1.49) при произвольном р. Таким образом, формулы (3.1.50), (3.1.51) дают искомое приближенное решение поставлен­ ной задачи (3.1.47), (3.1.48).

§2. Построение высших приближений

1.Уменьшение размерности системы уравнений прин­ ципа максимума. Перейдем к построению решении задач оптимального управления для систем стапдартпого вида (3.1.2) с произвольной наперед заданной степенью точ­ ности по малому параметру. В отличие от случая квази­ линейной системы (2.2.9), каноническая система урав­ нений краевой задачи принципа максимума (3.1.2), (3.1,19), (3.1.18) не имеет стандартного вида, а приведен­ ная к стандартной форме система (3.1.24) не является гамильтоновой. Поэтому представляется важным приве­ сти систему (3.1.24) к виду, обладающему привлекатель­ ным свойством каноничности. Это обстоятельство позво­ лит эффективно применить методику канонического ус­ реднения нз § 2 главы 2 .

Итак, рассматривается управляемая стандартная си­ стема с вращающейся фазой (3.1.2), для которой ставит­ ся терминальная задача оптимального управления. Так

как на размерность п медленного вектора a = (a i, ..., ап) не налагается ограничений, то, не ограничивая общности,

минимизируемый

функционал можно

взять

в виде J—

= а\{Т), 7, = @е“ 1, 0 = const> 0 . Чтобы

не загромождать

схему построения

приближенного решения,

считается,

что дополнительное требование (3.1.14) попадания векто­ ра па многообразие М(а) = 0 при t — Т пе наложено. От­ метим, что вся развиваемая далее процедура применима и при наличии этих ограничений. Ограничения на уп­ равление имеют по-прежнему вид u^U , где U — замк­ нутое множество. Предположим, что поставлеипая за­ дача оптимального управления имеет единственное реше­ ние для всех значений s е ,(0, 8о1. Как п раньше, по­ строение решения основано на необходимых условиях принципа максимума и метода усреднения. С заданной точностью по медленным переменным, управлению и

$ 21

ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ

145

функционалу строятся допустимые решения краевой за­ дачи, среды которых выбирается оптимальное.

Краевая задача принципа максимума имеет вид (3.1.2), (3.1.18), (3.1.19), где условия трансверсальности прини­ мают форму

р(Т) = (— 1, 0, ..., 0), 5 ( Я = 0.

(3.2.1)

Функции /*, F*, © из (3.1.20) предполагаются далее достаточно гладкими. Отметим, что функции /, ©, F в (3.1.2) могут непрерывно зависеть от параметра е, однако эта зависимость для сокращения записи не указывается.

Формула (3.1.23), полученная из условия постоянства гамильтониана (3.1.20), может быть представлена в виде

q = EQ (а, ф, р, /г, е) =

ем- 1 [h (р, /J)] X

 

X |1 - еоГ1

(р, tl)/dq + у ;]) + в» ...

(3.2.2)

Здесь через / о , F%

обозиачепы функции /*, JР*,

в ко­

торых (? = 0 . Формула (3.1.21) в силу условия трансвер­

сальности (3.2.1)

имеет вид

 

 

 

 

h

/ю (а, ф, р) |у,

(3.2.3)

где

/го — первая компопеыта вектора /о-

 

 

Подстановка выражения (3.2.2) ® систему (3.1.2),

(3.1.18), (3.1.19)

привадит к краевой задаче для стандарт­

ной системы, содержащей параметр h

 

 

а = е/* (я, i|), р, е 0 ,

ij) =

© (а) -f- eF* (а, т]>, р, sQ),

Р =

e<?f^

[(Р> /* (а>

Р,е<?)) +

 

 

 

 

+ GQF* (а, ф, р, е(?)],

(3.2.4)

 

я (У = а ° ,

1 >(*о)~Ч>°,

Р (П = ( - 1 , 0 , . . . , 0 ).

Здесь пулшо подставить (после дифференцирования по я) фупкцию q = &Q из (3.2.2).

После построения решения этой краевой задачи вели­ чина h определяется пз условия трапсверсальпостп (3.2.1) для q

<?(а(Г, h, е), ф(Г, h, е), р(Т), h, е) = 0. (3.2.5)

10 ф. л. Черноусько, Л. Д. Акуленко. Б. Н. Соколок

146

УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ

[ГЛ. 3

Далее должен быть выбран корень h* уравнения

(3.2.5),

доставляющий минимум функционалу

J=

= ai(r, h, е).

Решение задачи оптимального управления в первом приближении содержится в § 1. Для упрощения построе­ ния высших приближений уменьшим размерность систе­ мы (3.2.4) на единицу делением всех уравнений на *ф, что допустимо при достаточно малых е<=.[0 , е0] вслед­ ствие ш(а) > ©о> 0. В результате получим неавтономную

систему, в которой быстрая переменная — фаза

ф рас­

сматривается

как

независимая переменная (аргумент)

fQ(g, Ф, Р. fc, е)

 

dip “ 6 (о («) +

E F Q (я , ф, р , h, е)’

 

% “ - 6

+ в <р . W + 6< ? т £ ] <“ -I- е^ Г ‘ .

<3 -2 -е)

а(ф°) =

а0, р(фг) = (— 1 , 0 , ..., 0 ).

 

Здесь через /<?, Ря обозначены функции /*, F*, в ко­ торые подставлено выражение (3.2.2) для q, например,

/д(а, *ф, р, А, е) = /*(а, -ф, р, е(?).

Неизвестная величина фг в краевом условии (3.2.6) определяется соотношениями

Фг = ф|<=г,

_________dip'

(3.2.7)

© (я) + EFQ{U, ip'./J./t, в)

д|)0

Сюда вместо а, р подставляется как фупкцип аргу­ мента ф решение краевой задачи (3.2.6) при некоторых А, фг. Формула (3.2.7) при достаточно малом е устанав­ ливает взаимно однозначное соответствие между пере­ менными t и ф. Далее предполагается, что при заданных значениях параметров А из интервала [Aj, h2] и ф г ~ е - 1 решение модифицированной краевой задачи (3.2.6) су­ ществует и единственно.

Преобразования, в результате которых исходная авто­ номная гамильтонова система (3.1.2), (3.1.18), (3.1.19) сведена к системе (3.2.6), состояли в переходе к новому аргументу ф и в исключении переменной q, сопряжен­ ной ф, при помощи интеграла (3.1.20). Известно ([6 8 ],

§21

ттослтопттк высших привлттсгстт

147

стр. 128), что при такой замене получается каноническая система (уравнения Уиттекера) с гамильтонианом, рав­ ным — q, где q дано формулой (3.2.2). Следовательно, система (3.2.6) может быть записана в канонической форме

da

OQ

dp_

<? = е (« .+ .Р .Л .е ). (3.2.8)

 

<ip'

d\\>

в которой все переменные являются медленными. Функ­ цию Q считаем шике достаточно гладкой по аргументам я, р, в.

Исследование решения краевой задачи (3.2.6) на ос­ нове метода усреднения и определения решения задачи оптимального управления, содержится в п. 3.

2. Каноническая усредненная система. Система урав­ нений (3.2.8) может быть упрощена при помощи методи­ ки канонического усреднения по независимой перемен­ ной ф аналогично § 2 главы 2. Построим каноническое преобразование пеходпых переменных я, р к новым (ус­ редненным) Г|

S =

.

За

P - t i

.

За

 

 

+

e j j,

 

а =

а (я, т), ф , Л, е).

(3.2.9)

 

 

Здесь о — периодическая функция ф с периодом 2я. Потребуем, чтобы новый (усредненный) гамильтониан ей но содержал независимую переменную ф

$ - • ! ? . $ “

*•

Д - л « . л . л . « ) .

(3.2.10)

Система (3.2.10) имеет первый интеграл

 

Ж'|,

г|,

h,

е) = const.

(3.2.11)

Переходим к вычислению искомых функций а п R. Производящая функция (я, т]) + еа преобразования (3.2.9) и гамильтониан sR находятся с произвольно за­ данной степенью точности по е, определяемой гладкостью исходного гамильтониана е@, в виде разложений

о(я, т|, ф, К е) = о<>(я, ц, ф, h) + eoi + ... + екак+ . . .

Ж£, 11, h, е) = Ло(|, 11, Л) + еД| + . . . + еЛЖ + . . .

(3.2.12)

10*

148

УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ

1ГЛ. 3

 

Функции (3.2.12) связаны с гамильтонианом

системы

(3 .2 .8 ) дифференциальным соотношением в частных про­ изводных [210, 145]

Щ -

Q(а, Ч>,Р, ft, е) = Л (?, 11, ft, *).

(3.2.13)

Подставляя в

(3.2.13) выражеппя (3.2.0) для

по­

лучим нелинейное уравпеппо в частпых производных

% - e (e , t .4 +

e g . h, е) = R (а 4 е|Н,,,, А, *). (3.2.14)

Используя теперь в (3.2.14) представления для иско­

мых функций в

виде разложений (3 .2 .1 2 ), приравнива­

нием коэффициентов при одинаковых степенях е полу­ чим зацепляющуюся последовательность дифференциаль­ ных соотношений для щ, /?, (i ^ 0 ) впда

^ - Qi(а, ф, “П, h) = Ri (а, а], /г).

(3.2.15)

Здесь функции Qt на каждом шаге известны: они оп­ ределяются при помощи функции Q и ее производных, а также на основе функций о,-, Ri, вычпслеппых па пре­ дыдущих шагах. В частности, имеем

<?0 = Q(а, ф, 11, h, 0 ),

где индекс 0 отвечает е = 0. Уравнениям (3.2.15) удов­ летворяют функции

л , (5, П, А) = — <<?i> (?, л, ft),

 

 

2п

 

<Qi>(a,'(\ih) = ^

(Ма,ф,г|,й)<%

(3.2.17)

 

 

о

 

ffi (а, rj, ф, /г) =

( [(?г (а, ф ', т], Л) — « ? i> (а, л , /г)] йф ',

 

цГо

 

 

 

i = 0 , 1 , ...,fc , ...

 

Здесь первый

аргумент функций R{ обозначен через

| в соответствии

с (3.2.12),

угловые скобки

означают

усреднение по ф.

 

 

 

§2]

ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ

149

Таким образом, приближенное построение функции а п усредненного гамильтониана еД сводится к последова­ тельным вычислениям коэффициентов Q{ согласно (3.2.16)

иквадратурам (3.2.17).

3.Интегрирование усредненной системы. При помощи формул (3.2.12) выпишем систему (3.2.10) в (/с + 1)-м приближении

f W i > _

 

 

 

 

( 3 .2 .1 8 )

Здесь

0 = eij) — медленная

независимая

переменпая,

изменяющаяся па интервале

[0о, 0 Т],

где Oo = ei|)°, 0Г =

= eipr ~ 1.

В правых частях системы

(3.2.18)

отброшены

члепы (/с+1)-го и более высоких порядков по е. Поэто­ му при выполнении известных (см., например, [224]) условий существования решения систем (3.2.10), (3.2.18)

па интервале [0о, От! для

достаточно малых значений

параметра е справедливы оценки

II - 1{й+1)1 = OUh+1),

Iл - Л(ь+1)1 = ОС*™).

Построим общее решение системы (3.2.18) с погреш­ ностью 0(&h+l). Эти вычисления могут быть проведены па основе общего решения системы первого приближения

(3.2.18)

при

к = 0,

которая в силу (3.2.17) имеет вид

 

 

 

d%

0 <<?о)

 

 

 

 

 

d0

дц

(3.2.19)

 

 

 

dn

*<<?„)

 

 

 

 

Л(0r) =

 

 

 

d Q -

dt

Постоянные

cj,

c„ — произвольные

параметры, кото­

рые,

в частности, в первом приближении равны: с^ = а°,

=

(— 1 ,

0,

...,

0),

см. (3.2.6). Для

высших приближе­

ний параметры с6 и с„ лежат в е-окрестности казанных Далее считается известным общее решение задачи

(3.2.19), которое представим в виде

 

 

1 (1) = К'9, с8, сп), П(1>=

сг. сч)-

(3.2.20)

Функции | и л (не путать с переменными |, л в п. 2) зависят также от параметров 0о, 0 г и h} однако эта зави­ симость пока не указывается. Будем строить решение

150

УСРЕДНЕНИЕ П

НЕЛИНЕЙНЫХ ЗАДАЧАХ

[ГД. 3

системы

(3.2.18),

удовлетворяющее

условиям '|(Л-М)(0о) ==

= сг» il(h+i)(0 r) =

с„

в виде разложении

 

 

 

It

 

 

и

 

i(*+ i)

= id ) +

2

e*Si,

11(й+ 1) =

4(1) + S e4 i -

(3 .2 .2 1 )

 

 

i=l

 

i—-1

 

Здесь ппдекс вппзу у ц,- озпачаст помор коэффи­ циента в разложении. Неизвестпьтс функции ц, оп­ ределяются в результате решения линейной краевой за­ дачи, получаемой при подстановке (3.2.21) в (3.2.18) и прнравпивашш коэффициентов при одинаковых степе­ нях е

ili +

Vi (0 , С|, <д,

(0о) = О,

 

 

(3.2.22)

Здесь вторые производные

от R0 берутся

па порож­

дающем решении — первом приближении (3.2.20), а к,-, Wi — известные на каждом i-м шаге функции. Они опре­

деляются через коэффициенты R, и

решения

гр,

по­

строенные

на предыдущих шагах

(/ = 1 ,

2 , ..., £ — 1 ).

Например,

щ = ldR\/d\])t W\ = — {dR\/d%)

при

'i =

l(i)>

Чв Л(1)- Решение линейной неоднородной системы (3.2.22)

строится методом вариации произвольных постоянных иа основе общего решения соответствующей однородной си­ стемы. Фундаментальная матрица решений X для ука­ занной однородной системы, являющейся системой в ва­ риациях для (3.2.19), находится дифференцированием функций (3.2.20) по параметрам сЕ, с„. Учитывая началь­ ные н краевые условия (3.2.22), приходим к выражениям