Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Variatsionnoe_ischislenia

.pdf
Скачиваний:
20
Добавлен:
18.03.2015
Размер:
899.48 Кб
Скачать

являются граничными для выделения конкретной функции xˆ(t) из множества решений уравнения (II.8). Итак, мы получили такой результат: если функция x = x(t) доставляет минимум функционалу (II.6) с условиями (II.9) на классе C1[a, b], а сама дважды непрерывно дифференцируема на (a, b), то она необходимо удовлетворяет

уравнению Эйлера (II.8).

II.2.2 Вывод интегрального уравнения Эйлера

Можно снизить требование гладкости в общей простейшей задаче вариационного исчисления. Существование второй производной функций, являющихся аргументами функционала, нам понадобилось при выводе уравнения

Эйлера, а именно, при интегрировании по частям, связанном с перебрасыванием поизводной с ˙ на см. h D3L

формулу (II.7).

Произведем эту часть вычислений по-другому, наоборот, "накинув"производную на h в первом подинте-

гральном слагаемом. Итак, заменой вычислениям (II.7) являются следующие:

0 =

d

b

dt L(t, xˆ(t) + sh(t), xˆ(˙

t) + sh˙ (t))

=

ds

Z

 

 

 

 

 

 

a

 

s=0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= Z

b

 

 

 

 

 

D2L(t, xˆ(t), xˆ(˙ t)h(t)) + D3L(t, xˆ(t), xˆ(˙ t)h˙ (t)) =

 

a

n

 

dt

 

o

t)) h˙ (t). (II.10)

 

=

b

t

dτ D2L(τ, xˆ(τ ), xˆ(˙ τ )) + D3L(t, xˆ(t), xˆ(˙

 

 

Z

 

Z

 

 

 

 

a

a

 

 

 

 

 

 

Теорема 12. (Дюбуа Реймонд5)) Пусть g C(a, b) и интегрируема на [a, b]. Если

b

Z

˙

для любых

(a, b),

dt g(t)h(t) = 0

h C0

a

то g(t) ≡ const на (a, b).

Доказательство. Возьмем какую-нибудь функцию ψ0(t) C0с

b

Z

dt ψ0(t) = 1.

a

Любая функция ϕ(t) C0представима в виде

b

Z

ϕ(t) = ψ0(t)

a

˙

ϕ(τ )dτ + h(t)

с некоторой h C0. Достаточно заметить, что

t

b

Z

Z

(ϕ(t1) − ψ0(t1) ϕ(t)dt)dt1 ≡ h(t) C0.

 

 

 

 

 

 

a

 

a

Положим c0

b

 

 

 

 

 

 

= g(t)ψ0(t) dt. Заметим, что

 

 

 

R

 

 

 

 

 

 

 

 

 

a

 

ϕ(t)

 

 

 

ϕ(τ )dτ dt =

0 =

b

g(t)h˙ (t)dt =

b g(t)

ψ0

b

 

Z

 

 

Z

 

 

Z

 

 

a

 

 

a

 

 

a

b

 

b

b

 

= Za

g(t)ϕ(t)dt − c0

Za

ϕ(τ )dτ = Za

[g(t) − c0] ϕ(t)dt.

По теореме 11 получаем, что g(t) − c0 ≡ 0 на (a, b).

5) Dubois Raymond (Дюбуа Реймонд Пауль, 1831-1889 ) немецкий математик,основные работы относятся к математической

физике, анализу, вариационному исчислению.

Итак, вместо (II.8) получаем необходимое условие оптимальности xˆ(t):

Za

t

 

D2L(τ, xˆ(τ ), xˆ(˙ τ ))dτ + D3L(t, xˆ(t), xˆ(˙ t)) = const,

(II.11)

которое называется интегральным уравнением Эйлера и должно выполняться для функций x = xˆ(t), доставляющей локальный минимум функционалу J (x) на классе C1[a, b]

Заметим, что первое слагаемое в равенстве II.11 непрерывно дифференцируемо как интеграл с переменным

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

˙

верхним пределом от непрерывной функции. Поэтому непрерывно дифференцируема и функция D3L(t, xˆ(t), xˆ(t)),,

то есть существует предел

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

≡ I(t)

 

 

 

 

 

 

 

 

 

 

 

t→0

t hD3L(t + t, xˆ(t + t)) − D3L(t, xˆ(t), xˆ(t))i

 

 

 

 

 

 

 

 

 

 

 

lim

 

 

 

 

˙

 

 

 

 

 

 

Аккуратное вычисление дает

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

˙

˙

 

 

 

 

 

 

 

 

 

I(t) = D1D3L(t, xˆ(t), xˆ(˙ t)) + D2D3L(t, xˆ(t), xˆ(˙

t)) lim

xˆ(t + δt) − xˆ(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t→0

t

 

 

 

 

 

 

2

 

 

˙

 

 

 

 

¨

 

 

 

 

 

 

 

 

Значит, если D3 L(t, xˆ(t), xˆ(t)) 6= 0, то существует xˆ(t).

 

 

 

 

 

 

 

 

Общий результат можно сформулировать так

 

 

 

 

 

 

 

 

Теорема 13.

Если L C

2

([a, b] ×

R2

) и xˆ доставляет минимум функционалу (II.6) на

классе функций C1[a, b],

 

 

 

 

2

 

˙

 

при

то xˆ является

решением интегрального уравнения Эйлера. Если дополнительно D

 

L(t, xˆ(t), xˆ(t)) = 0

 

2

(a, b)

 

 

 

 

 

 

 

 

3

 

 

6

 

t (a, b), то xˆ C

 

и удовлетворяет дифференциальному уравнению Эйлера (II.8).

 

 

II.2.3 Роль метрики области определения функционала

Существование экстремума зависит от выбора пространства, на котором рассматривается функционал. Пример 9. Есть минимум на пространстве C1, но нет минимума на пространстве C2

1

dt (|t| − x˙ (t))2 ,

 

J (x) = Z

x(0) = 0.

−1

 

 

Минимум на пространстве C1 дает экстремаль x(t) = sgn t · t22 .

Накладывая дополнительные ограничения (например, требования гладкости), мы сужаем область определения функционала, и даже если он имеет локальный экстремум на функции, удовлетворяющей этим ограничениям, уменьшаем множество аргументов, попадающих в окрестность локального экстремума. Обратно, ослабление метрики окрестностей экстремалей расширяет эти окрестности. Традиционно, локальный экстремум на максимально широком множестве называется сильным, на суженой окрестности – слабым. Точнее, в классической задаче вариационного исчисления

b

Z

J (x) = L(t, x(t), x˙ (t))dt → min

a

требование сильного минимума означает, что экстремаль принадлежит классу KC1[a, b] кусочно-непрерывно дифференцируемых функций и доставляет минимум в окрестности, заданной топологией C[a, b]. Слабый минимум определяется классом C1[a, b] для экстремали и при выделении ее окрестности.Обращение в нуль в точке

минимума производной функционала, является необходимым условием слабого минимума. Однако, мы это уже отмечали, дифференциальное уравнение Эйлера выполняется, если только экстремаль имеет вторую производную.

Если экстремаль сильного экстремума непрерывно дифференцируема, то необходимое условие слабого экстремума, естественно, является необходимым условием и сильного экстремума, a достаточное условие сильного экстремума является достаточным и для слабого.

II.3 Экстремаль с подвижными концами

II.3.1 Вывод уравнения Эйлера для функционалов на вектор-функциях

Можно рассматривать функционалы на вектор функциях x : R1 → Rn. Не происходит никаких изменений в

выводе уравнений Эйлера. Поэтому окончательные результаты формулируются аналогично. Запишем, напри-

b

мер, необходимое условие слабого экстремума, рассматривая функционал J (x) = R L(t, x(t), x˙ (t))dt на функциях

a

x : [a, b] → Rn, x C1[a, b]и L = L(t, x, u)-функции 2n+1 переменной t [a, b], (x, u) R2n

Теорема 14. Пусть L C2([a, b] × R2n) Если xˆ C2[a, b]и доставляет слабый минимум функционалу, то xˆ является экстремалью - решением векторного уравнения Эйлера

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

D2L(t, x, x˙ ) −

 

D3L(t, x, x˙ ) = 0

 

 

 

 

 

 

 

dt

где D2L = (

∂L

 

∂L

T

 

∂L

 

∂L

T

 

, · · · ,

 

)

,

D3L = (

 

, · · · ,

 

)

 

 

 

∂x1

∂xn

∂u1

∂un

 

 

 

Задача 13. Доказать самостоятельно теорему 17

II.3.2 Формула вариации функционала

В отличие от простейшей задачи будем считать, что концы тех кривых, на которых определен функционал, могут сдвигаться произвольным образом. То есть мы рассматриваем функционал

b

 

 

J (x) = Za

L(t, x(t), x˙ (t))dt,

x : R1 → Rn,

на функциях x(t) заданных на некотором отрезке [A;B] содержащем всевозможные отрезки [a(x), b(x)] Вариацией функционала J (x) мы называем линейную часть приращения функционала относительно беско-

нечно малых приращений его аргументов. такими аргументами будут вектор-функция x(t), и концы отрезка интегрирования a и b. Строго говоря "вариация" - это дифференциал функционала. Но удобнее сохранить ис-

торически сложившееся понятие вариации, оставив на будущее уточнение независимо меняющихся аргументов функционала, опираясь на понятие производной как основное - (I.1.3).

Итак, мы полагаем (считая s → 0)y(t, s) = x(t) + sh(t) + o(s), a(y) = a(x) + s · a(x) + o(s), b(y) = b(x) + s · b(x) + o(s)

Вариация функционала γ(x) обозначается δγ(x)

δJ (x) = J (y) − J (x) + o(s) =

 

b(x)

 

=

Z

L(t, x(t) + sh(t) + o(s), x˙ (t) + sh˙ (t) + o(s)) − L(t, x(t), x˙ (t)) dt+

 

a(x)

h

i

 

a(x)

b(y)

 

Z

 

Z

+

[L(t, x(t), x˙ (t)) + o(s)] dt +

[L(t, x(t), x˙ (t)) + o(s)dt] + o(s) ≡

a(y)

b(x)

 

≡ I + II + III.

Первый интеграл преобразуем так же, как мы делали при выводе уравнения Эйлера только без предположения об обращении функции h(t) в нуль на концах отрезка интегрирования. Ниже, сокращяя обозначения, вместо

группы аргументов (t, x(t), x˙ (t)) будем писатьn

: Например

ˆ

˙

· ·

>

(t)

 

L(t) = L(t, x(t), x˙ (t)), L(t) = L(t, xˆ(t), xˆ(t)), < ,

будем обозначать скалярное произведение в R . Придем к выражению

b(x)

I = s Z

D2L(t) − dt D3L(t)

, h(t)

 

 

d

 

t=b(x)

dt + hD3L(t), h(t)i|t=a(x)

a(x)

Во втором и третьем интегралах выделим главные линейные по s a и s b части

II = −sL(a, x(a), x˙ (a))Δa + o(s), III = sL(b, x(b), x˙ (b))Δb + o(s)

Здесь и далее обозначения сокращены: a = a(x), a = a(x), b = b(x), b = b(x). Приращения значений на концах интервала определения функции y выражаются более сложной чем обычно, формулой, так как сам

интервал подвижен

y(a) ≡ y(t, s)|t=a(x)+s a(x)+o(s) −x(a) = x(a+s a+o(s))−x(a)+sh(a+s a+o(s))+o(s) = s [x˙ (a)Δa + h(a)]+

o(s) ≡ dyds(a) |s=0s + o(s). Аналогично y(b) = s[x˙ (b)Δb + h(b)] + o(s) = dyds(b) |s=0s + o(s)

Таким образом, на концах интервала интегрирования приращения h, y, t не являются независимыми. Для будущих применений нам удобно оставить независимыми переменными t, y, выражая через них

h(a), h(b) Очевидно,sh(a) = y(a) − sx˙ (a)Δa + o(s), sh(b) = y(b) − sx˙ (b)Δb + o(s). Подставляя это в выражение

Рис. II.3:

для δJ , приходим к окончательной формуле вариации функционала

 

b

δJ (x) = s Za

 

d

hD2L(t) −

 

D3L(t); h(t)idt+

dt

 

 

 

+ hD3L(b); y(b)i + s [L(b) − hD3L(b); x˙ (b)i] b−

 

 

 

− hD3L(a); y(a)i − s [L(a) − hD3(a); x˙ (a)i] a. (II.12)

Формула (II.12) получена в предположениях L C2([AB] × R2n), x, y C2[A, B]

Задача 14. Снять молчаливо предположенные ограничения

 

 

 

a(y) < a(X) < b(x) < b(y)

II.3.3 Условия трансверсальности.

Необходимым условием достижения экстремума функционала J (x) на функции x = xˆ(t) является обращение в

 

 

ˆ

 

d

 

ˆ

нуль вариации функционала и в, частности, выполнение уравнения Эйлера D2L(t) −

dt

D3L(t) = 0. Благодаря

этому на экстремали уравнение δJ (ˆx) = 0 превращается в условия на концах отрезка

[a, b]

 

 

hD3Lˆ(t), y(t)i + hLˆ(t) − hD3Lˆ(t), xˆ(˙ t)ii

t|tt==ab = 0

 

 

 

(II.13)

Если в постановке задачи концы кривой в аргументах функционала предполагаются закрепленными, то

x(a) = y(a) =

x(b) = y(b) = 0 и (II.13) выполняются автоматически.

 

 

 

 

Пусть концы кривой подвижны и перемещаются по заданным гладким кривым.

 

 

 

 

 

1 = {x|x = ϕ(τ )}, 2 = {x|x = ψ(τ )}, ϕ, ψ C1, y(a) 1, y(b) 2.

 

Пусть a = a(ˆx) = ϕ11), b = b(ˆx) = ψ11) В этом случае

 

 

 

 

 

y(a) = ϕ˙ (τ1)s

˙

 

 

 

 

 

a + o(s), y(b) = ψ(τ2)s b + o(s) и ввиду независимости приращений на разных концах a

иb (II.13) превращается в формулы

 

 

ˆ

 

 

ˆ

ˆ

˙

 

 

 

hD3L(a), ϕ˙ (τ1)i + L(a) − hD3L(a), xˆ(a)i = 0

 

 

 

ˆ

˙

 

ˆ

ˆ

˙

(II.14)

 

 

hD)3L(b), ψ(τ2)i + L(b) − hD3L(b), xˆ(b)i = 0

Эти граничные условия называются условиями трансверсальности.

 

 

В частности, для встречающихся в вариационных˙

задачах механики функций L вида L(t, x, v) = l(t, x)|v| D3L =

 

. Граничные условия (II.14) упрощаются. l

hx,˙ ψi

+ l|x˙ | − l|x˙ | = 0 или hx,˙ ϕˆi = 0

 

 

|x|

|x˙ |

 

То есть условия трансверсальности в этом случае означают ортогональность экстремалей к направляющим кривым .

Приведем пример использования формулы вариации функционала.

Пример 10. Мы ищем путь - кусочно непрерывную дифференцируемую x = (x1(t), x2(t)) KC1[a, b] минимальной длины, соединяющую две точки плоскости A = (a1, a2)и B = (b1, b2) в обход области, расположенной ниже своей границы = {x|x = ϕ(s)}. (См. рис. II.3)

В отсутствие препятствия кратчайший путь дается отрезком прямой, соединяющей точки A и B. Это оче-

видно и так, и можно получить как решение задачи на безусловный экстремум:

T

p

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

 

2

2

 

 

d x˙

S =

dt

12(t) + x˙ 22(t)

→ min, x(0) = (a1, a2), x(T ) = (b1

, b2)

0

 

 

 

 

 

 

 

 

 

 

 

 

 

Лагранжиан L(t, x, v) =

 

v1 + v2

. Уравнение Эйлера

 

 

 

= 0, его решение x˙ (t) = const, x(t) = αt + β,, есть

 

dt

|x˙ |

прямая линия,

проведенной через точки A и B.

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

В основном варианте задачи эта прямая пересекает Ω, и естественно предположить, что расположенная выше прямой часть области Ω является выпуклой. Если она невыпуклая, то следует взять выпуклую оболочку её, на рисунке (II.3) мы получим выпуклую оболочку, проведя общую касательную [A2, B2] к двум вершинам

первоначальной области. Итак верхняя часть границы

= {x|x = ϕ(s), s [s1, s2], ϕ C1 ϕ(s1) = C, ϕ(s2) = D} ограничивает выпуклую область Ω. Искомый кратчайший путь состоит из экстремалей, непересекающихся с и кусочков границы . Как мы уже нашли

выше, экстремали являются отрезками прямых линий. Вопрос заключается в том, чтобы определить координаты точек A1, B1 сопряжения экстремалей с границей .

Пусть A1 = (a11, a12) = x(t1) = ϕ(sA1 ), B1(b11, b12) = x(t2) = ϕ(sB1 ). Минимизирующий функционал

 

 

t1

 

 

 

sB

 

 

T

 

 

 

 

 

 

 

 

 

 

J (x) = Z0

|x˙ (t)|dt +sZA (ϕ˙ (s))ds + tZ2

(x˙ (t))dt.

 

 

 

 

 

Он является суммой трех функционалов. Поэтому вариация J (x) есть

 

 

 

 

 

 

δJ (x) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

|x˙ (t1)|

i

+ s |x˙ (t)| − h

|x˙ (t1)| 1 i

t1

 

 

 

= s Z0

h−dt |x˙ (t)|, h(t)idt + h

 

 

 

 

 

 

d x˙ (t)

 

 

x˙ (t1), y(t1)

 

 

 

 

x˙ (t1), x˙ (t )

 

 

 

 

 

 

 

− s|ϕ˙ (sA1 )| t1 + s|ϕ˙ (sB1 )| t2+

 

 

 

 

 

 

 

 

T

h−dt |x˙ (t)|, h(t)idt − h

2x˙ (t2)

i − s |x˙ (t2)| − h

x˙ (t2)

i

t

 

 

+ s tZ2

 

 

 

 

 

d x˙ (t)

 

 

x˙ (t

), y(t2)

 

 

x˙ (t2), x˙ (t2)

 

 

Необходимое условие экстремума δJ (ˆx) = 0. Интегралы пропадают в силу уравнения Эйлера. оставляя граничные члены в точках A1 и B1, которые должны обращаться в нуль по отдельности из-за независимости

приращений t1 и

t2. Это приводит к таким равенствам.

 

 

1

hx˙ (t1), y(t1)i − s|ϕ˙ (sA1 )| t1

= o(s),

 

 

 

 

 

|x˙ (t1)|

 

1

hx˙ (t2), y(t2)i − s|ϕ˙ (sB1 )| t2

= o(s).

 

 

 

 

 

|x˙ (t2)|

Заметим, что

y(t1) = sϕ˙ (sA1 )Δt1 +o(s), y(t2) = sϕ(sB2 )Δt2 +o(s), потому что точки A1 и B1 перемещаются

по графику . Таким образом, для векторов ej = x˙ (tj )/|x˙ (tj )| и ǫj =

y(tj )/| y(tj )| имеем равенства hej , ǫj i =

1 + o(1), j = 1, 2 . . . . Это возможно только при коллинеарности векторов x˙ (t1) и ϕ˙ (sA1 ), а также x˙ (t2) и ϕ˙ (B1) То есть экстремали - прямые линии , в точках сопряжения с границей должны ее касаться. Конечно, это

было ясно с самого начала, но мы разобрали задачу, чтобы разъяснить смысл формулы вариации функционала.

II.3.4 Условия на изломе экстремали

Из общей формулы вариации функционала (II.12) можно получить следствия для кусочно гладких экстремалей:

непрерывных, но с разрывами первого рода производных в некоторой точке t (a, b). Как мы выяснили раньше

в точке разрыва производных экстремали необходима вырожденность матрицы ˙ Экстремаль

2

D3 L(t , xˆ(t ), xˆ(t ).

можно считать состоящей из двух частей: для t [a, t ] и t [t , b]. При t = t 0 должны выполняться

 

 

 

 

 

 

 

ˆ

формулы вариации функционала. С учетом выполнения уравнения Эйлера эти формулы имеют вид: δJ (t 0) =

ˆ

ˆ

ˆ ˙

 

 

 

ˆ

ˆ

±[D3L(t)Δy(t)] + [L(t) −hD3L(t), xˆ(t)i]Δt|t=t 0 Наличие экстремума означает δJ (t −0) + δJ(t + 0) = 0 Отсюда,

учитывая произвольность возмущений

y(t 0) =

y(t и

t(t 0) =

t(t ), получаем условия на изломе

 

ˆ

ˆ

ˆ

ˆ

ˆ ˙

ˆ

ˆ

экстремали [D3L](t ) ≡ D3L(t +0)−D3L(t −0) = 0 и [L−hD3L, xˆi](t ) ≡ (L−hD3L, xˆi)(t +0)−(L−hD3L, xˆi)(t −

0) = 0.

 

 

 

 

 

 

 

 

Чтобы прояснить геометрический смысл этих условий , произведем такие преобразования. Сделаем замену

переменных (t, x, v, L(t, x, v))

(t, x, p, H(t, x, p)) по формулам p = D

 

L, H =

L +

h

D

L, v . Если матрица

2

 

 

3

 

 

3

i

D3 L(t, x, x˙ (t)) невырождена, то эта замена локально обратима: при заданных (t, p, H(t, x, p)),H = hD3L; vi−L =

hp, vi − L, получаем D3H = v + hDpv · p − DpvD3L = v То есть v = D3H, L = −H + hp, D3Hi.

Преобразуем уравнения Эйлера. D2L = −D2H − DxpD3H + DxpD3H = −D2H, D3L = p. Мы имеем dpdt = −D2H. Сюда добавляем соотношение dxdt = v = D3H.

Получается система уравнений симметричного вида

x˙ = Hp p˙ = −Hx

a

Её называют канонической системой уравнений Эйлера функционала J (x) = L(t, x(t), x˙ (t))dt, Гамильтоно-

 

 

R

6)

 

 

b

 

вой системой уравнений. Переменную p называют импульсом, функцию H -Гамильтонианом .

Теорема 15.

Если замена переменных глобально обратима, то задача J (x) →

min эквивалентна задаче

b

x

 

 

 

R

 

 

 

J (x, p) ≡ [hp, x˙ i − H(t, x, p)] dt →

min

 

x,p

 

a

 

 

 

Доказательство. Достаточно показать, что min J (x, p) = J (x). Уравнение Эйлера для функционала J (x, p) -

p

по p при фиксированных x, есть Dp [hp, x˙ i − H(t, x, p)] = 0, или x˙ = DpH(t, x, p). Но тогда hp, x˙ i − H(t, x, p) =

hp, D3Hi − H = L и необходимо min min J (x, p) = min J (x).

x p x

Замена переменных (v, L(t, x, v)) → (P, H(t, x, p)) с переходом к каноническим переменным p ≡ D3L, H ≡ −L+hD3L, vi показывает что условия на изломе экстремали означают непрерывность в точке излома экстремали

этих переменных.

Дадим этому геометрическую иллюстрацию.

Рис. II.4:

 

 

 

 

 

 

 

˙

К поверхности (v → L(v)) L = L(t, x(t), v) касательные плоскости, в точках v = xˆ задаются уравнениями

h

L

˙

 

0))

, N i = 0

 

v − xˆ(˙ t 0)

 

 

 

L(t, xˆ(t ), xˆ(t

 

 

 

где

 

 

 

 

 

 

(t )

N (t ) = grad(L,v)(L − L(t , xˆ(t ), v))|v=xˆ(˙ t 0) = −D3

 

 

 

 

 

 

1

 

ˆ

ˆ

˙

 

 

Так как нормаль N (t) в точке t непрерывна, то

. То есть это уравнение: L −L(t 0) −hD3L(t ), v −xˆ(t 0)i = 0

эти касательные плоскости параллельны. Покажем, что они даже совпадают. Для этого достаточно в уравнение одной плоскости подставить координаты точки касания другой и убедиться в том, что получается тождество.

Проделаем это:

 

 

 

 

 

 

˙

 

 

 

 

 

 

 

 

 

 

(L

 

ˆ

 

0)

 

D

ˆ

 

), v

 

 

 

 

0) )

L=Lˆ (t +0) =

L(t

− h

L(t

xˆ(t

 

 

 

3

 

 

 

 

 

 

i | v=xˆ(˙ t +0)

 

ˆ

 

 

 

ˆ

 

˙

 

 

 

 

ˆ

 

 

D

ˆ

˙

 

(t

) = 0

= hL(t ) − hD3L(t ), xˆii

(t ) = h

L

 

 

L, xˆ

ˆ

− h

3

 

 

ii

 

 

Заметим, что если матрица D32L положительно определена, то поверхность {v|L = L(t, xˆ(t), v)} строго вы-

пуклая. Для нее не может быть совпадения проведенных к разным точкам касательных плоскостей. Значит, и экстремаль не может иметь излома.

6) Gamilton W. R. (Гамильтон Уильям Роуан, 1805 - 1865) ирландский математик, выписал "уравнения Гамильтона"в 1835 г.,

основные работы относятся к механике и теории дифференциальных уравнений.

Глава III

Условный экстремум

III.1

Функционал с одним интегральным ограничением.

III.1.1

Конечномерная задача на условный экстремум

В качестве пояснения и наводящего соображения о подходах к задачам минимизации функционалов при дополнительных ограничениях разберем конечномерную задачу нахождения минимума функции двух переменных.

f (x1, x2)

f (x1, x2) → min при дополнительном условии g(x1, x2) = c. Рисунок линий уровней этих функций показывает что в точке P , лежащей на кривой g(x) = c, и дающей минимальное значение функции f , линии уровня f и g

касаются друг друга (см. рис. III.1).

Рис. III.1:

Дадим этому строгое обоснование.

Теорема 16. Пусть требуется найти

 

 

min

f (x)

x

Ω

R2

 

g(x) = const = c

 

Если xˆ внутренняя точка Ω, то векторы Df (ˆx) и Dg(ˆx) должны быть коллинеарны.

Доказательство. Если эти векторы не коллинеарны, то Df (ˆx) имеет ненулевую проекцию на касательную в

точке к линии {x| g(x) = const} -(см. рис. III.2).

 

 

 

 

 

 

 

Поэтому для близкой точки x на линии {x | g(x) = const} имеем g(x ) = const = c,

 

 

 

 

 

f (x ) = f (ˆx) + f (x )

f (ˆx)

 

)

 

 

 

 

 

 

 

 

 

 

≈ f (ˆx

+ Df (ˆx)(x − xˆ) =

 

 

 

 

 

= f (ˆx) + Df (ˆx) · τ |x − xˆ|.

 

 

Здесь τ = (x

xˆ)/ x

| выбираем с таким направлением,

чтобы вектор

Df (ˆx), укaзывающий направление

 

|

 

 

 

 

убывания f , удовлетворял условию h−Df (ˆx), τ i > 0 и тогда f (x ) < f (ˆx), то есть f (ˆx) не есть минимальное

значение.

Рис. III.2:

27

Итак,

λ0Df (ˆx) + λ1Dg(ˆx) = 0 или

D [λ0f (x) + λ1g(x)]|x=ˆx = 0 и λ20 + λ21 > 0.

III.1.2 Теорема бесконечномерного анализа с одним условием интегрального вида

В качестве задачи на условный экстремум функционала рассмотрим сначала простейшую задачу вариационного исчисления с дополнительными ограничениями интегрального типа, сужающим область определения функционала.

Найти минимум функционала

b

 

 

 

J (x) = Za

dtL(t, x, (t), x˙ (t))при условиях x(a) = xa x(b) = xb,

(III.1)

 

G(x) = Za

b

 

 

dtM (t, x, (t), x˙ (t)) = k = const

(III.2)

Теорема 17. Дана задача (III.1), (III.2), xˆ точка минимума, DG(ˆx) =6 0 и L C1(R3), M C1(R3). Тогда для любого h : (DG(ˆx)h = 0 DJ (ˆx)h = 0).

Доказательство. Легко показать, что F DG и F DJ существуют. Предположим противное утверждению теоремы, то есть пусть существует такое h, r что DG(ˆx)h = 0 и DJ (ˆx)h ≡ α =6 0. Так как DG(ˆx) =6 0, то существет h1 такое, что DG(ˆx)h1 ≡ β =6 0. Нам дано условие (III.2) G(x) ≡ k = const. Подберем число s1 так, чтобы было k = G(ˆx + sh + s1h1). Конечно, s1 является функцией от s, s1 = s1(s). Для этой функции выполняется уравнение

k = G(ˆx) = G(ˆx + sh + s1h1) = G(ˆx) + DG(ˆx)(sh + s1h1) + r(ˆx, sh + s1h1),

где остаток r = o(sh+s1h1). Cокращая на G(ˆx), получаем условие 0 = s1β+r, причем остаток r, рассматриваемый как функция от s и s1, дифференцируем в нуле и

∂s s=s1 =0 = 0 и

∂s1 s=s1 =0 = 0.

∂r

 

∂r

 

 

 

 

 

 

 

 

 

Можно применить обычную теорему о неявной функции для выражения s1 через s. А именно, функция s1 = s1(s)

определена в окрестности нуля, дифференцируемая в нуле и кроме того,

 

 

 

 

 

 

 

 

 

 

 

 

 

∂(s1

β + r)

 

 

 

 

 

 

 

 

 

ds1

 

 

 

 

 

 

 

 

 

 

 

 

 

s1(s)|s=0 = 0,

ds

 

s=0

= ∂(s1

β + r)

= 0.

 

 

 

 

 

 

 

 

 

 

 

 

∂s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂s1

s=s1 =0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, s

1

= s

 

o(1)

при s

 

0. Теперь запишем

получившееся противоречие

 

·

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J (ˆx + sh + s1h1) = J (ˆx) + DJ (ˆx)(sh + s1h1) + · · · = J (ˆx) + [s · α · (1 + o(1))].

Выражение в квадратных скобках имеет разные знаки в окрестности точки s = 0 и поэтому J (ˆx) не может быть минимумом функционала J (x) (и максимумом тоже).

Теорема 18. Если ядро одного линейного функционала l1 содержится в ядре другого l2, Ker l1 Ker l2, то l2 = λ l1.

Доказательство. Если l1 = 0, то и l2 = 0 и утверждение теоремы тривиально. Пусть l1 6= 0. Тогда существует h1 : l1h1 = β 6= 0, и значит для любого h существует s такое, что l1(h − sh1) = l1h − sβ = 0. Т.е. s = l1βh . Т.к. l1(h − sh1) = 0, то и l2(h − sh1) = 0. И значит l2h = sl2h1 = l1βh l2h1 ≡ λl1h, где λ ≡ l2βh1 , то есть l2 = λl1.

Теорема 19. Необходимым условием min (или max) задачи условного экстремума является необходимое условие безусловного экстремума функционала Λ = J − λG с некоторой постоянной λ.

Доказательство. По теоремам 17, 18 DJ (ˆx) = λDg(ˆx). То есть D[J (x) − λg(x)] |x=ˆx = 0 .

Итак, в задаче условного экстремума, искомая экстремаль xˆ = xˆ(λ) определяется из условия DΛ(ˆx) = 0. Нужное λ следует определить из условия G(ˆx(λ)) = k = const. Этот путь решения называется методом множителей

Лагранжа.

Замечание 3. Мы не использовали конкретный вид функционалов J и G. То есть утверждения сохраняются

для любых дифференцируемых по Фреше функционалов.

III.1.3 Задача Дидоны 1)

Пример 11. На плоскости найти кривую l = {(x1, x2) | x1 = x1(t), x2 = x2(t), t [0, T ]}, которая, имея фиксированную длину, соединяет две точки A и B оси абсцисс и вместе с отрезком AB ограждает область

наибольшей площади (см. рис. III.3).

Рис. III.3:

Пусть длина кривой есть S > b − a

TT

ZZ

q

g(x) = | x˙ | dt = x˙ 21(t) + x˙ 22(t)dt = S

00

Огражденная площадь равна

(a,0)

(b,0)

J (x) = Z

x2dx1 − x1dx2 + Z

x2dx1 − x1dx2.

(b,0)

 

(a,0)

 

На отрезке горизонтальной оси x2 = 0 и dx2 = 0. Поэтому второй интеграл исчезает

T

Z

J (x) = dt(x2 1 − x12)

0

Стоит задача J (x) −→ max при условии g(x) = S.

Решение:

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 = D [J (x) + λg(x)] h =

 

d

Z

dt [(x21 − x12)+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

12 + x˙ 22

x=ˆx+τ h!τ =0 =

 

опускаем

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

далее значокˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ λ

1

˙

 

+ x˙

˙

#

=

 

 

 

 

 

 

 

 

 

 

 

= dt "x2h˙ 1 + h21 − x1h˙ 2

− h12

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h1

+ x˙ 2h2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

=

T

dt "

2x2 +

2

+ x˙ 2

! h˙ 1 − 2x1

 

2

+ x˙ 2 ! h˙

2# .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z

 

 

 

 

 

 

 

 

 

 

 

 

λx˙ 1

 

 

 

 

 

λx˙

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

1

2

 

 

 

p

1

 

2

 

 

По теореме Дюбуа Реймонда

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2x2

+

 

 

λx˙ 1

= c1,

2x1

 

 

 

λx˙ 2

 

= c2,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

+ x˙ 2

 

 

2 + x˙ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

1

2

2

 

 

 

 

 

p 2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λx˙

= q1 + x˙ 2 =

 

 

λx˙

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c2

 

 

 

c1

 

 

 

 

 

c1 − 2x2

2x1 − c2

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть y1 = x1

, y2 = x2

. Уравнения для y имеют вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

λy˙1

 

 

 

 

 

 

 

 

 

λy˙2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= q12

+ y˙22 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−2y2

2y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) Дидона легендарная царица одного из финикийских городов. Изгнанная с родины, проплыла с дружиной вдоль южного

побережья Средиземного моря и основала Карфаген (ныне Тунис), испросив у аборегенов на побережье кусок земли, огражденный согласно решению "задачи Дидоны".

или

 

λ2 2

 

 

 

 

 

 

 

 

 

1

= y˙12 + y˙22 и 1y1 = −y˙2y2.

 

4

y2

2

 

 

 

 

 

 

 

Второе уравнение интегрируется y12 + y22 = c3, или

 

 

 

 

 

 

 

 

 

c2

2

c1

 

2

 

 

 

 

 

 

 

 

 

x1

 

 

+ x2

 

 

= c3.

 

2

2

Это уравнение окружности радиуса c3. Окружность должна проходить через точки (a, 0) и (b, 0). Поэтому c2 = a + b,

3

 

2

 

 

2

2

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

b − a

 

 

c1

 

 

 

b−a

 

 

 

 

 

 

 

c

=

 

 

 

+

 

 

 

 

= c2

+ (b a)2

/2

(III.3)

центральный угол с основанием на хорде [a, b] равен 2 arctg

c1

. Поэтому дуга окружности равна

 

 

 

 

 

 

 

 

c1

 

 

3

 

 

 

 

 

 

 

 

 

 

2 arctg

b − a

 

 

 

= S.

 

(III.4)

 

 

 

 

 

 

 

c

 

 

Уравнения (III.3), (III.4) позволяют определить c1 и c3. Например, уравнение на c1 получается таким

 

 

 

 

 

 

 

c1

q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

S +

 

arctg

b − a

 

 

 

 

c2

+ (b

 

 

a)2 = 0.

 

 

 

 

 

 

 

 

 

 

 

Итак, кривая, охватывающая наибольшую площадь, оказалась дугой окружности.

Задача 15. Проверить, что если в задаче Дидоны концы кривой не закреплены, а могут скользить по оси

абцисс, то условия трансверсальности будут означать перпендикулярность оси абцисс к кривой на ее концах.

III.2

Задача Лагранжа

 

 

 

 

 

III.2.1

Формулировка теоремы по задаче поиска минимума функционала с несколь-

 

кими интегральными ограничениями

 

Пусть требуется найти

 

 

 

 

 

 

 

b

 

 

 

xb)

 

x C1[a,b]

Za

 

a

 

min J (x) =

L(t, x(t), x˙ (t))dt (x(a) = x , x(b) =

 

при дополнительных условиях

 

 

 

 

 

 

 

b

 

 

 

 

 

Gj (x) = Za

 

 

 

(III.5)

 

gj (t, x(t), x˙ (t)) = 0, j = 1, k

Теорема 20. Пусть L, gj C2([a, b] × R2), функционалы DGj (xˆ)kj=1 решение поставленной задачи. Тогда существует такой ненулевой

линейно независимы. x = xˆ(t) C2[a, b] вектор λ = (λ1, . . . λk ) Rk , что функция

k

λj Gj (x) на множестве C1

T

jP

x = xˆ(t) доставляет безусловный минимум функционалу J (x) +

[a, b] (x(a) =

=1

 

 

a, x(b) = b)

 

 

Мы предлагаем самостоятельно обосновать это утверждение, повторяя в основном, доказательство предыдущей теоремы, и начав со следующего вспомогательного предложения (взамен теоремы 17).

Задача 16. (Доказывается рассуждением от противного)

 

C1

(a, b) (h(a) = h(b) = 0)

 

. . . , µ

 

)

 

Rn, такой, что если функция h

 

Существует ненулевой вектор µ = (µ1,n

k

 

 

 

T

и принадлежит ядру функционала K =

j

 

 

j

 

 

 

µ DG (ˆx), то она лежит в ядре функционала DJ (ˆx).

 

jP

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

III.2.2 Задача Лагранжа

 

 

 

b

Пусть поставлена задача условного экстремума. Найти минимум функционала J (x) =

L(t, x(t), x˙ (t))dt на

1

 

 

R

 

 

 

a

множестве функций x(t) = (x1(t) . . . , xn(t)) C [a, b], x(a) = xa, x(b) = xb при наложенных условиях вида

 

 

 

(III.6)

gj (t, x(t), x˙ (t)) = 0, j = 1, k.

Эта вариационная задача называется задачей Лагранжа. Отметим, что переход на n-мерные вектор функции существенен. Действительно, если n = 1, то из одних только уравнений неизвестная функция пред-

ставляется почти однозначно, - может быть с точностью до некоторых постоянных параметров, функционал J (x) превращается в обычную функцию этих параметров.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]