Rozova_Maximova
.pdf
|
|
|
|
|
|
∂ψ k (t, x) |
|
|
n |
∂ψ k (t, x) |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
|
|
|
|
ψ j . |
|
|||||
|
|
xk = |
|
|
|
|
|
∂t |
|
|
|
∂x j |
|
|
|
||||||||||
Таким образом, |
|
|
|
|
|
|
|
|
|
|
|
j=1 |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
∂f |
|
|
∂ 2 f |
|
|
|
|
n |
|
∂ 2 f |
|
|
|
n |
∂ 2 f |
|
|
|||||||
|
|
− |
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
= |
||||||
|
∂xi |
|
∂t |
|
|
|
|
|
xk − |
xk |
|||||||||||||||
|
|
∂xi |
|
|
|
k =1 |
|
∂xi ∂xk |
k =1 |
∂xi ∂xk |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
∂f |
|
|
|
d ∂f |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
= |
|
|
− |
|
|
= 0, i = 1, n. |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
∂xi |
dt ∂xi |
|
|
|
|
|
|
|
||||||||||
Таким образом, |
получили систему уравнений Эйлера, т.е. |
кривые по определению образуют поле. Достаточность доказана.
Доказательство необходимости предоставляем читателю (аналогичные рассуждения проводим «снизу вверх»).
8.6.Инвариантный интеграл Гильберта
иего свойства
Пусть γ – некоторая кривая, x Rn.
Опр. 6. Интегралом Гильберта называется криволинейный интеграл вида:
|
∂f (t, x, x) |
|
|
J (γ ) = − H (t, x, x)dt + ( |
|
, dxγ ) , где |
|
∂x |
|||
γ |
|
||
|
|
|
H (t, x, x) = − f (t, x, x) + (∂f (t, x, x) , x) = ∂x
=− f (t, x, x) + n ∂f (t, x, x)xi .
i=1 ∂xi
Пусть x =ψ(t,x) задает поле функционала F(x) такое, в которое одна из экстремалей входит как составляющая, ψ(t,x)
– наклон поля. Обозначим кривую γ через xγ (t) . Рассмотрим J (γ ) на поле функционала F(x), тогда
81
|
J (γ ) = [ f (t, x,ψ ) − ( |
∂f (t, x,ψ ) ,ψ )]dt + ( |
∂f |
, dxγ ) = |
|||||||||
|
∂x |
||||||||||||
|
γ |
|
|
|
∂x |
|
|
|
|
|
|
||
|
|
|
|
∂f |
|
|
|
|
∂f |
|
|
|
|
|
|
n |
|
|
|
n |
|
|
|
|
|||
|
= [ f (t, x,ψ ) − |
|
|
|
ψ k |
+ |
|
|
|
xγ ]dt = |
|||
|
|
|
|
|
|
||||||||
|
γ |
|
|
|
|
|
|
|
|
|
|||
|
k =1 ∂xk |
|
|
k =1 ∂xk |
|
|
|
||||||
|
|
= [ f (t, x,ψ ) − |
|
|
|
∂f |
)]dt. |
|
|||||
|
|
|
+ ψ , |
|
|
|
|||||||
|
|
(−xγ |
∂x |
|
|||||||||
|
|
γ |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Свойства интеграла Гильберта. |
|
|
|
|
||||||||
I. |
Если |
xγ (t) является |
элементом |
поля, т.е. |
|||||||||
|
xγ (t) =ψ(t, xγ ), |
|
то J(x)=F(x). Доказательство оче- |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
видно.
II.J (γ ) не зависит от пути интегрирования γ, а зави-
сит только от начальной и конечной точки пути. Док-во. По критерию поля условия I и II являются необходимыми и достаточными условиями того, что под интегралом Гильберта стоит полный дифференциал, и таким образом, интеграл не зависит от пути.
8.7. Достаточные условия сильного экстремума
Рассмотрим следующую задачу:
b |
f (t, x(t), x(t))dt → extr, |
(8.5) |
F(x) = |
||
|
|
|
a
с краевыми условиями x(a)=xa, x(b)=xb в классе x(t) C[a,b], функция f (t, x(t), x(t)) трижды непрерывно дифференцируе-
ма по совокупности переменных.
Опр. 7. Говорят, что допустимая функция xˆ(t) доставляет сильный локальный минимум (максимум) в задаче (8.5), если существует такое δ>0, что F(x)≥F( xˆ ) (F(x)≤ F( xˆ ))
82
для любой допустимой функции x, для которой
x − xˆ C[a,b] < δ .
Теорема (достаточные условия сильного экстре-
мума).
Пусть
I.xˆ = xˆ(t) – допустимая экстремаль задачи (8.5),
т.е. |
|
xˆ |
|
удовлетворяет уравнению |
Эйлера |
||||
|
∂f |
|
− |
d |
|
∂f |
= 0 |
и краевым условиям |
x(a)=xa, |
|
∂x |
|
|
|
|||||
|
|
dt ∂x |
|
|
|
x(b)=xb;
II.xˆ = xˆ(t) может быть окружена полем;
III.Функция Вейерштрасса
E(t, x,ψ , x) = f (t, x, x) − f (t, x,ψ ) − (x −ψ , ∂f (t, x,ψ )) ≥ 0
∂x
или (≤ 0) для любых x : x − xˆ C[a,b] < δ , x,ψ .
Тогда xˆ = xˆ(t) доставляет сильный локальный экстремум
функционалу F(x).
Док-во. Рассмотрим приращение функционала F(x) воспользуемся свойствами интеграла Гильберта:
F = F(x) − F(xˆ) = F(x) − J (xˆ) =
b |
|
|
|
∂f |
|
|
|
|
|
= f (t, x, x)dt − ( − H (t, x,ψ ) + ( |
|
|||
a |
γ |
|
|
|
b |
|
∂f (t, x,ψ ) |
,ψ ) |
|
|
|
|||
= [ f (t, x, x) − f (t, x,ψ ) + ( |
∂x |
|||
a |
|
|
|
|
|
|
|
|
|
b |
f (t, x,ψ ) − (x − ψ , |
= [ f (t, x, x) − |
|
|
|
a |
|
F(x) − J (xγ ) =
(t, x,ψ ) , dxγ )) = ∂x
− (∂f (t, x,ψ ) , xγ )]dt
∂x
∂f (t, x,ψ ))]dt.
∂x
и
=
83
b
Имеем F = E(t, x,ψ , x)dt.
a
Таким образом, если для любых
x : x − xˆ C[a,b] < δ , x,ψ
функция Вейерштрасса E(t, x,ψ , x) ≥ 0 |
(или ≤ 0), то и F≥ 0 |
|
|
(или ≤ 0), т.е. экстремаль xˆ доставляет функционалу F(x) экстремум (по определению), что и доказывает теорему.
Замечание. Условия:
|
∂ |
2 |
|
|
|
|
|
а) P(t) = |
|
f (t, x, x) |
|
x= xˆ |
> 0 (< 0) |
||
|
|
|
2 |
|
|||
|
|
|
∂x |
|
|
|
|
и
б) на интервале (a,b) нет сопряженных точек τ, являются достаточными условиями того, что экстремаль можно окружить полем. Утверждение приводим без доказательства.
Учитывая приведенное замечание, достаточные условия сильного экстремума могут быть сформулированы в виде следующей теоремы.
Теорема (достаточные условия сильного экстре-
мума).
Пусть
I.xˆ = xˆ(t) – допустимая экстремаль задачи, т.е. xˆ
удовлетворяет уравнению Эйлера |
∂f |
− |
d ∂f |
= 0 |
и |
||
∂x |
|
|
|
||||
|
|
dt ∂x |
|
|
краевым условиям x(a)=xa, x(b)=xb;
II. Выполнено усиленное условие Лежандра:
|
∂ |
2 |
|
|
|
|
|
P(t) = |
|
f (t, x, x) |
|
ˆ |
> 0 (< 0) ; |
||
|
|
|
|
|
|||
|
|
|
|
2 |
|
x= x |
|
|
|
|
∂x |
|
|
|
|
III.На интервале (a,b] нет сопряженных точек;
84
IV. Функция Вейерштрасса
E(t, x,ψ , x) = f (t, x, x) − f (t, x,ψ ) − (x − ψ , ∂f (t, x,ψ )) ≥ 0
∂x
или (≤ 0) для любых x : x − xˆ C[a,b] < δ , x,ψ .
Тогда xˆ доставляет сильный локальный экстремум функционалу F(x).
Замечание. Известно, что условия II, III, IV являются также и необходимыми условиями экстремума. Тогда, если какое-то из данных условий не выполнилось, то экстремума в задаче нет.
План исследования на сильный экстремум.
Для исследования задачи на сильный экстремум нуж-
но:
1. Выписать уравнение Эйлера |
∂f |
− |
d ∂f |
= 0 . |
||
∂x |
|
|
|
|||
|
|
dt ∂x |
|
2.Решив полученное дифференциальное уравнение, найти решение x=x(t,C1,C2).
3.Воспользовавшись краевыми условиями x(a)=xa, x(b)=xb, найти произвольные постоянные C1, C2.
4.Проверить выполнение усиленного условия Ле-
|
∂ |
2 |
|
|
|
|
|
жандра: P(t) = |
|
f (t, x, x) |
|
ˆ |
> 0 (< 0) . |
||
|
|
|
|
|
|||
|
|
|
|
2 |
|
x= x |
|
|
|
|
∂x |
|
|
|
|
5.Составить уравнение Якоби: Q(t)h − dtd P(t)h = 0 .
6.Решить полученное дифференциальное уравнение с краевыми условиямиh(a) = 0, h(a) = 1.
7.Проверить, обращается ли полученное решение h(t) в ноль на интервале (a,b] (графически или ана-
85
литически). Тем самым выяснить, есть ли сопряженные точки на интервале (a,b].
Если не выполнилось какое-либо из условий 4,7, то слабого, а тем более сильного, экстремума в задаче нет.
8. Выписать функцию Вейерштрасса и проверить, сохраняет ли она знак для любых
x : x − xˆ C[a,b] < δ , x,ψ .
Если не выполнено условие Вейерштрасса, то в этом случае найденная допустимая экстремаль не доставляет сильного экстремума в классе функций из пространства
C[a,b].
Пример 1. Исследовать на экстремум:
1 (x3 + x2 )dt → extr, x(−1) = −1, x(1) = 3.
−1
Решение. Экстремалями данного функционала явля-
ются прямые x = C1t + C2 .
Подставляем краевые условия и получаем допустимую экстремаль x = 2t + 1 .
|
Проверяем усиленное условие Лежандра |
|
|
||||||||||||
P(t) = |
∂ 2 |
f |
|
|
xˆ |
= 14 > 0 (возможен минимум). |
|
|
|||||||
|
|
|
|||||||||||||
|
2 |
|
|
|
|||||||||||
|
∂x |
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
Составляем уравнение Якоби Q(t)h − |
P(t)h = 0 , где |
|||||||||||||
|
dt |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
|
|
Q(t)=0, |
P(t)=14. |
Тогда |
14 |
|
h = 0 . |
Откуда |
получаем |
||||||||
dt |
|||||||||||||||
h(t) = С1t + C2 . |
|
|
|
|
|
|
|
|
|
||||||
|
Воспользовавшись |
|
краевыми |
|
условиями |
||||||||||
h(−1) = 0, h(−1) = 1, |
находим решение |
уравнения Якоби |
86
h(t) = t + 1. На интервале (–1, 1) кривая h(t) = t + 1 не обра-
щается в нуль, следовательно, нет сопряженных точек, а следовательно, экстремаль доставляет функционалу слабый минимум.
Проверим условие Вейерштрасса. Выпишем функцию Вейерштрасса:
|
|
|
|
|
|
|
|
|
|
|
|
∂f (t, x,ψ ) |
) . |
||
E(t, x,ψ , x) = f (t, x, x) − f (t |
, x,ψ ) − (x − ψ , |
|
|
||||||||||||
|
|
3 |
|
|
2 |
|
|
3 |
|
|
2 |
|
∂x |
2 |
|
|
|
|
|
−ψ |
−ψ |
|
+ 2ψ ) = |
||||||||
E(t, x,ψ , x) = x |
+ x |
|
|
− (x − ψ )(3ψ |
|
||||||||||
|
3 |
|
|
2 |
+ |
2ψ |
3 |
+ ψ |
2 |
|
|
|
|
|
|
= x |
|
+ x |
|
|
|
− xψ (3ψ + 2). |
|
Функция Вейерштрасса не устанавливает знак для любых x,ψ , следовательно, нет сильного экстремума. Таким
образом, экстремаль доставляет функционалу слабый, но не сильный минимум.
Пример 2. Исследовать на экстремум:
1 |
1 |
|
|
|
|
(t + 2x + |
|
2 |
)dt → extr, x(0) |
= 0, x(1) = 0. |
|
2 |
x |
|
|||
0 |
|
|
|
|
Решение. Уравнение Эйлера для этого функционала имеет вид x = 2 . Экстремалями являются параболы
x = t 2 + C1t + C2 . Подставляем краевые условия и находим допустимую экстремаль x = t 2 − t .
|
Проверяем усиленное условие Лежандра |
|
|
||||||||
P(t) = |
∂ 2 |
f |
|
|
xˆ |
= 1 > 0 (возможен минимум). |
|
|
|||
|
|
|
|||||||||
|
2 |
|
|
|
|||||||
|
∂x |
|
|
|
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Составляем уравнение Якоби |
− |
|
h = 0 или |
h |
= 0 . |
|||||
|
dt |
||||||||||
Его общее решение h(t) = С1t + C2 . |
|
|
|
|
|
||||||
|
Подставляем краевые условия |
h(0) = 0, h(0) = 1 |
и по- |
лучаем h(t) = t . Данная кривая нигде на интервале (0,1] в
87
нуль не обращается, следовательно, нет сопряженных точек,
следовательно, экстремаль x = t 2 |
− t |
доставляет функциона- |
|||||||||
лу слабый минимум. |
|
|
|
|
|
|
|
|
|
|
|
Функция Вейерштрасса имеет вид: |
|
||||||||||
|
1 |
|
2 |
− t − 2x |
1 |
ψ |
2 |
− |
|
||
E(t, x,ψ , x) = t + 2x + |
2 |
x |
|
− 2 |
|
(x −ψ )ψ = |
|||||
|
1 |
|
|
|
|
|
|
|
|
|
. |
= |
|
|
|
2 |
≥ 0. |
|
|
|
|
||
2 (x −ψ ) |
|
|
|
|
|
||||||
Отсюда видно, |
что для любых x,ψ она является зна- |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
копостоянной, следовательно, на экстремали данный функционал достигает сильного минимума.
88
9.Оптимальное управление
9.1.Постановка задачи оптимального управления
Будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется n фазовыми координатами x1,…,xn. Векторное пространство X переменной x=x1,…,xn является фазовым пространством рассматриваемого объекта.
Будем предполагать, что закон движения объекта записывается в виде системы дифференциальных уравнений:
x = f (x1 ,..., xn , u1 ,..., ur ) = f (x, u) |
, |
(9.1) |
|
|
|
где f=f1(x,u),…,fn(x,u) – вектор-функция, определенная для
любых значений векторной переменной x X. Вектор-функцию u=u1,…,ur будем называть управле-
нием. Определим допустимые функции u(t).
Класс допустимых управлений.
Допустимые функции – это функции u(t), удовлетворяющие одному из ниже приведенных условий I и условию
II.Например,
I. Аналитические условия.
•Кусочно-непрерывные функции на отрезке
[t0,T]. Это функции, непрерывные на отрезке [t0,T], всюду, за исключением конечного числа
точек τ1,…,τN [t0,T] и разрывами I рода и u(t0+0)= u(t0), u(t1–0)= u(t1).
•Кусочно-постоянные функции.
•Измеримые и ограниченные по t, u L∞[t0,T].
•Гладкие функции u(t) C1[t0,T].
II.Условия на значения.
• Значения функции u(t) U Rr.
89
Таким образом, допустимое управление u(t) удовлетворяет двум условиям: аналитической характеристике и условиям на значения.
В задаче оптимального управления присутствует краевая задача. Есть множество начальных состояний M0, т.е.
x(t0) M0, и множество конечных состояний M1: x(t1) M1. В частности, можно рассматривать двухточечную задачу: x(t0)=x0 , x(t1)=x1 при M0 = x0, M1= x1.
Рассмотрим пару (x(t),u(t)), где u(t) – допустимое управление, x(t) – отвечающая этому управлению траектория
системы (9.1) с краевыми условиями x(t0)=x0 M0 и x(t1)=x1 M1.
Рассмотрим функционал:
t1
I = f0 (x, u)dt , где f0(x,u) – заданная функция.
t0
Каждой паре (x(t),u(t)) ставится в соответствие число I. Этот функционал I называется критерием качества управления.
Критерий качества может иметь физический смысл: расход топлива, финансовые затраты, время перехода из одной точки в другую и т.д.
Для того чтобы получить конкретную траекторию (кон-
кретное движение), надо: |
|
|
|
|
1. |
выбрать управление u=u(t) как некоторую функцию |
|||
|
времени; |
|
|
|
2. |
задать начальное условие x(t0)=x0; |
~ |
|
|
3. |
решить задачу Коши |
|
(t, x) , x(t0)=x0. |
|
x = f (x(t), u(t)) = |
f |
Тогда получим конкретное решение системы дифференци-
альных уравнений x(t)=x(t,x0,t0,u).
90