Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая экономика

.pdf
Скачиваний:
190
Добавлен:
22.03.2015
Размер:
3.49 Mб
Скачать

В подобных случаях приходится использовать приближенные численные методы. При этом возникает ситуация, сходная с той, которая рассматривалась в гл. 5 в связи с отысканием экстремума функции: можно использовать необходимое условие экстремума, решая систему уравнений

xfi = 0 каким-либо приближенным методом, а можно использовать про-

цедуру поиска экстремума, рассматривая непосредственно (напрямую) заданную функцию f(x). На практике чаще прибегают к использованию прямых методов решения.

Рассмотрим сущность наиболее известных подходов подобного рода на примере простейшей задачи 1, рассмотренной в § 7.2.

Требуется найти функцию x = x(t) , t [tн,tк] , для которой

x(tн) = xн; x(tк) = xк заданы,

а функционал

tк

J = ϕ[x(t), x(t),t]dt min

tн

принимает минимальное значение.

Метод Ритца

Введем в рассмотрение некоторую функцию α0 (t) , удовлетворяющую заданным граничным условиям:

α0 (tн) = xн; α0 (tк) = xк,

а также систему линейно-независимых функций {α1(t),α2 (t),...αm (t)},

удовлетворяющих условиям

αi (tн) = αi (tк) = 0 .

Искомое решение будем искать в виде

m

 

x(t) = α0 (t) + ciαi (t) ,

(7.18)

i=1

где сi – подлежащие определению коэффициенты.

Подставив эту функцию в функционал (7.2) и выполнив интегриро-

вание, получим выражение, зависящее от неизвестных величин сi:

 

J = J (c1,...,cm ) .

(7.19)

Теперь задача свелась к отысканию численных значений ci = ci*, при которых функция (7.19) будет минимальна.

221

Заметим, что представление решения в форме (7.18) дало возможность свести задачу о минимизации функционала к задаче о минимизации функции.

Для ее решения можно использовать необходимое условие:

J = 0 , i =1, m .

ci

Если решение этой системы уравнений вызывает затруднения, то можно использовать рассмотренные в § 5.3 – 5.4 численные методы поиска экстремума.

Пример. Рассмотрим задачу об отыскании функции x = x(t) , для ко-

торой

0 t 1;

x(0) = 0 ;

x(1) =1;

J = 1 (x2 (t) + x2 (t))dt min .

0

В § 7.2 было найдено решение этой задачи с помощью уравнения Эйлера – Лагранжа.

Выберем в качестве базисных функций αi (t) многочлены

α0 (t) = t ,

при этом

α0 (0) = 0 ;

 

α0 (1) =1,

α (t) =t(t 1) ,

α

2

(t) =t2

(t 1) ,…, α

n

(t) =tn (t 1) .

1

 

 

 

 

Ограничимся аппроксимацией 2-го порядка, полагая n=1. Тогда

x x(t) = t + c1t(t 1) = ct2 + (1 c)t .

Заметим, что для любого с граничные условия выполняются. Рассмотрим компоненты, входящие в функционал: x2 = c2t4 2c(c 1)t3 +t2 (1 c)2 ;

x′ = 2c t +(1c) ;

x2 = 4c2t2 + (1 c)2 + 4c(1 c)t .

Тогда

1

c2t4

2c(c 1)t3 + t2 ((1 c)2 + 4c2 )+ t4c(1 c) + (1

J J =

0

 

 

c)2 dt.

После интегрирования и подстановки пределов получаем

J =| J = 1130 c2 16 c + 43 .

222

Используя условие

dJdc = 1511 c 16 = 0 ,

находим

c=c*= 225 .

В результате получаем искомое приближенное решение x* = t + 225 t(t 1) .

Заметим, что точное решение, найденное в § 7.2, определяется выражением

x* = e 1e1 (et et ) .

Для оценки полученного результата в табл. 7.1 приведены значения

*~*

xи x для нескольких значений ti.

 

 

 

 

Т а б л и ц а 7.1

 

 

 

 

 

 

t

Точные значения, x

*

 

~*

 

 

 

Приближенные значения, x

 

 

 

 

Метод Ритца

Метод Эйлера

 

0

0

 

0

0

 

0,2

0,171

 

0,164

0,171

 

0,4

0,350

 

0,345

0,350

 

0,6

0,542

 

0,545

0,542

 

0,8

0,756

 

0,764

0,766

 

1

1

 

1

1

 

Метод Эйлера

Он основан на разбиении рассматриваемого промежутка времени на небольшие части ∆t=h и представлении искомой функции x=x(t) отдельными дискретами:

x(t0 ) = xн, x1 = x(t0 + h),..., xi = (t0 +ih),..., xN = x(t0 + Nh) = xk ,

где N = (tк tн) / h .

При этом производные приближенно заменяются конечными разно-

стями

x'(ti ) x = xi+1 xi , t h

223

а функционал (7.2) приближенно вычисляется по формуле прямоугольников

tк

+ ϕ1 +... + ϕN 1]

 

J = ϕdt ≈ ∆t[ϕ0

(7.20)

tн

 

 

В результате получается выражение, зависящее от неизвестных значений искомой функции x1,x2,…xN-1. Задача сводится к отысканию значений xi = xi* , при которых функция

J = J (x1,..., xN 1) min

принимает наименьшее значение.

Эту задачу, как и в предыдущем случае, можно решить аналитически, используя необходимые условия экстремума, или с помощью численных методов поиска экстремума.

Пример. Рассмотрим ту же, что и в предыдущем случае, задачу. Промежуток 0 t 1 разобьем на 5 частей с шагом h = ∆ t = 0,2. В результате искомая функция будет представлена дискретными отсчетами

 

 

 

 

 

{x0, x1, x2, x3, x4, x5},

 

 

 

 

 

 

 

 

 

 

 

 

 

 

причем x0 = x(0) = 0 и x5 = x(1) = 1, а числа x1,…,x4

необходимо определить

так, чтобы функционал (7.20) достиг минимума.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для рассматриваемого случая запишем следующие соотношения:

J h[ϕ0 + ϕ1 + ϕ2 + ϕ3 + ϕ4 ],

 

 

ϕi = xi2 + x 'i2 = xi2 +

(xi+1 xi )2

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h2

 

 

 

 

 

 

 

J h(x2

+ x2

+ x2 + x2 + x2 ) +

1 [(x x

0

)2 + (x

2

x )2

+ (x

3

x

2

)2 +

 

0

 

1

2

3

 

4

 

 

h

1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

+ (x

4

x )2

+ (x

5

x

4

)2 ]= h(x2

+ x2

+ x2

+ x2 + x2 ) +

 

 

 

 

 

 

 

 

3

 

 

 

 

 

0

 

 

 

1

 

2

 

 

3

4

 

 

 

 

 

 

 

1

2

2

2

2

 

2

 

2

 

2

(x1x0 + x2x1

+ x3x2 + x4x3 + x5x4 ).

+ h

(x0 + 2(x1

+ x2 + x3 + x4 + x5 ))h

 

После приведения подобных членов с учетом x0=0 и x5=1 получаем

 

J = 1 + h + 2 (x2

+ x

2

+ x2

+ x2 )

2

(x

x

+ x x

 

+ x

x +1* x

 

 

). (7.21)

 

h

 

 

h 1

2

 

3

 

 

4

h

 

 

 

2 1

 

3

2

 

 

4 3

 

 

 

 

4

 

224

Рассмотрим условия экстремальности J по xi:

J

=

h +

2 2x 2 x = 0,

 

 

 

x1

 

 

1

 

h

2

 

 

h

 

 

 

 

 

J

=

h +

2

2x

2

(x

+ x ) = 0,

 

 

 

x2

 

2

h

1

3

 

 

h

 

 

 

 

J

 

 

h +

2

 

2

 

 

 

=

2x

(x

+ x ) = 0,

 

 

x3

 

3

h

2

4

 

 

h

 

 

 

 

J

=

h +

2

2x

2

(x

+1) = 0.

 

 

 

 

x4

 

4

h

3

 

 

 

h

 

 

 

 

После преобразований эта система принимает следующий вид:

ax1

= x2

,

 

 

 

ax

= x

+ x ,

2

1

 

3

, ,

ax

= x

 

+ x

3

2

4

 

 

ax

= x

 

+ x ,

 

4

3

1

 

где a = h2 + 2 = 2,04.

Последовательно исключая переменные, можно получить следующие выражения, дающие значения оптимального решения в выбранных точках ti:

x* =1/ ;

x* = a / ;

x* = (a2

1) / ;

x* = a(a2

2) / ,

1

2

3

 

4

 

где ∆ = a4 3a2 +1.

После подстановки в эти формулы значения a = 2,04 получаются отсчеты приближенного решения xi, приведенные в табл. 7.1.

Заметим, что в данном случае минимизацию функционала (7.21) удалось осуществить аналитически. В более сложных случаях для этого можно использовать численные алгоритмы поиска экстремума, изложенные в

§ 5.3 – 5.4.

Рассмотренные прямые методы Ритца и Эйлера можно применить и для решения более сложных задач ВИ и динамической оптимизации, используя специальные приемы, позволяющие учесть ограничения, фигурирующие в условиях задачи.

Проиллюстрируем это на примере задачи управления с минимизацией затрат энергии (более подробно эта задача будет рассмотрена в § 8.3). В

225

этом случае необходимо найти управляющее воздействие u=u(t), 0 t tк, при котором показатель качества

tк

J = u2 (t)dt min

0

принимает минимальное значение и выполняются условия связи vy''==kuv, ,}

а также граничные условия

= ν0; y(tк) = y

k

к

– заданы.

y(0) = y0; y (0)

 

; y (tк) = ν

 

Для использования метода Эйлера осуществляем следующие дейст-

вия:

разобьем промежуток времени [0;tк] на N частей с шагом ∆t = h = = tк /N;

будем рассматривать переменные u,y,v в полученные дискрет-

ные моменты времени: yi=y(ti); vi=v(ti); ui=u(ti); i=0,1,..N;

введем вспомогательный функционал, используя идею метода штрафов для учета уравнений модели

tk

2

 

 

2

 

2

 

 

J = {u

(t) + M

+ (v 'ku)

(7.22)

 

( y 'v)

 

 

}dt ,

0

 

 

 

 

 

 

 

 

где М – некоторое достаточно большое число;

заменим этот функционал (7.22) его дискретным аналогом, используя метод прямоугольников для интегрирования и конечные разности для дифференцирования:

~

N 1

y

 

y

 

 

2

v

 

v

 

 

2

 

 

 

h

 

i+1

i

 

i1

i

 

 

 

 

J

ui2

+ M

 

 

vi

+ M

 

 

 

kui

 

 

,

(7.23)

 

 

h

 

 

 

h

 

 

 

i=0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где y0,v0 и

yN,vN – заданы, а дискреты {u0,u1..un}, {y1,..yN-1}, {v2,..vN-1} подле-

жат определению;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для полученного выражения (7.23) применим одну из процедур поиска минимума по переменным ui, yi, vi.

Следует отметить, что хотя все изложенные выше действия являются вполне обоснованными, тем не менее, как показывает опыт их применения, при их практической реализации возникают серьезные трудности [35]:

226

медленная сходимость, ненадежность результатов и др. Эти трудности связаны, в частности, с тем, что минимизируемые функции, например (7.23), обычно имеют «овражный» характер, обладают несколькими локальными экстремумами, в каждом из которых процедура поиска может остановиться и др.

Контрольные вопросы

1.Какой класс задач рассматривается в вариационном исчислении?

2.Как определяются понятия «вариация», «функционал» и «экстремум функционала»?

3.Приведите примеры функционалов.

4.Как формулируется классическая задача ВИ и как записывается необходимое условие экстремума функционала (уравнение ЭйлераЛагранжа):

для одной искомой функции,

для нескольких искомых функций.

5.Как формулируется классическая задача ВИ при наличии дополнительных уравнений связи и каким образом можно их учесть при использовании уравнений Эйлера-Лагранжа?

6.В каких случаях используется условие трасверсальности и как оно записывается?

7.Как формулируются задачи Лагранжа, Майера и Больца, в чем их сходство и отличие?

8.В чем состоит специфика задач динамического оптимального управления и каким образом эти задачи можно свести к классическим задачам вариационного исчисления?

9.В каких случаях приходится использовать приближенные методы при решении задач ВИ?

10.В чем состоит сущность метода Ритца для решения задач ВИ?

11.В чем состоит сущность метода Эйлера при решении задач ВИ?

Примечание. Задачи для самостоятельного решения по данной теме приведены после 9-й главы.

227

Глава 8. ПРИНЦИП МАКСИМУМА И ЕГО ПРИМЕНЕНИЕ

ДЛЯ СИНТЕЗА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ

ВНЕПРЕРЫВНЫХ СИСТЕМАХ

§8.1. Формулировка принципа максимума для непрерывных систем

Рассмотрим задачу о динамическом управлении непрерывной системой, математическая модель которой сведена к стандартной форме

 

 

 

x

= f (x ,..., x ; u ,...,u

m

;t),

 

 

 

 

1

1

1

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

x

= f

2

(x

,..., x

; u

,...,u

m

;t),

(8.1)

 

 

 

2

 

1

 

 

n

1

 

 

 

 

 

 

 

 

 

.............................................

 

 

 

 

 

x

= f

n

(x

,..., x

;u ,...,u

m

;t).

 

или

n

 

1

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

x′ = f

(x,

u

, t) ,

 

 

 

 

 

 

(8.1 а)

 

 

– столбец правых частей уравнений; n – порядок

 

 

где f = f1, f2 ,..., fn

системы; xi = xi (t)

– переменные состояния;

u j =u j (t) – управляющие

воздействия.

 

 

 

 

 

 

 

 

 

 

 

u

 

 

u

(t)

 

 

 

Необходимо

найти управление

 

=

на

промежутке времени

tн t tк так, чтобы выполнялись условия:

 

 

 

 

 

 

 

 

 

1) система была

переведена

из

 

заданного

начального состояния

 

 

x(tн) = xн

в такое состояние в конечный момент времени t =tк,

чтобы первые l переменных xi совпали с заданными значениями

xi (tк) = xiк, i =1, l ; l n ;

2) заданный показатель качества управления в виде функционала

tк

 

J = f0(x,u,t)dt min

(8.2)

tн

достигал минимума;

3) выполнялись все ограничения на управление u (и возможно на переменные состояния x ), например

ai ui bi .

(8.3)

Заметим, что для части переменных состояния ( xl +1 ,..., xn ) их значения в конечный момент времени не заданы и могут быть любыми. Если

228

принять l = n , то переменных со свободными значениями в момент времени t =tк нет.

Будем предполагать, что функции f0 , f1,..., fn являются непрерывными по u, непрерывно дифференцируемыми по x и кусочнонепрерывными по t [17].

Введем вспомогательные функции ψi (t), i = 0,1,...,n. С их помощью

сформируем следующее выражение:

 

H = H (x ,u ,ψ,t) = ψ0 f0 + ψ1 f1 +... + ψn fn .

(8.4)

Оно определяет так называемую функцию Гамильтона.

 

Теорема (принцип максимума Понтрягина) [31]. Если

u

=

u

* (t)

– оп-

тимальное управление, а x = x* (t) – соответствующие оптимальные переменные состояния, определяемые (8.1), то существуют ненулевые непрерывные функции ψi (t) , при которых:

1)

функция Гамильтона достигает максимума, т.е.

 

 

H (x* ,u *,ψ,t) H (x ,u ,

ψ

,t) ;

(8.5)

2)

функции ψi удовлетворяют уравнениям

 

 

 

dψi

= −H , i =

 

;

(8.6)

 

 

1, n

 

 

dt

 

 

x

 

 

 

 

i

 

3)

ψ0 = −1; ψi (tк) = 0 при i = l +1,..., n .

(8.7)

Эта теорема определяет необходимые, но в общем случае недостаточные условия оптимальности управления.

Следует отметить, что принцип максимума (ПМ) обладает важными отличительными особенностями по сравнению с базовыми результатами вариационного исчисления:

1)он сформулирован непосредственно для задач управления, в его структуре фигурируют переменные состояния x , управления u , связывающая их модель (8.1) и ограничения на них, например

(8.3);

2)формулировка имеет довольно удобный и универсальный характер;

3)он охватывает известные в ВИ необходимые условия экстремальности функционала;

229

4)ограничения на свойства управляемой системы (правые части модели f1,..., fn ) и критерий качества f0 , предполагаемые в ПМ, имеют гораздо менее жесткий характер, чем в ВИ, в частности, оптимальное управление может иметь разрывный, скачкообразный характер, типичный для многих прикладных задач;

5)для важного частного случая, когда управляемая система описывается линейной моделью, ПМ определяет необходимые и достаточные условия оптимальности управления [31].

Если в конечный момент времени t =tксостояние системы не зафиксировано или задано частично только для нескольких переменных:

x (t

 

) = xк, i =

 

, l < n ,

(8.8)

к

1, l

i

i

 

то можно рассматривать более общую форму показателя качества, чем

(8.2):

tк

 

J = F(x(tк)) + f0(x,

u

,t) dt min

(задача Больца). (8.9)

tн

 

Можно показать (см., например, [24, 30]), что в этом случае определяемые принципом максимума условия остаются теми же, но дополняются условиями трансверсальности:

ψi (tк) = −

F(x)

 

, i =l +1, l + 2,..., n ,

(8.10)

 

xi

 

x =x*

 

 

 

 

которые записываются для индексов i, соответствующих незафиксированным переменным.

В том случае, когда конечный момент времени tк заранее не определен (задача с нефиксированным временем), для решения необходимо ввести дополнительное условие [31]:

H (x*,

u

*,ψ,t)

= 0 ,

(8.11)

 

 

 

t =t

 

 

 

 

 

 

 

 

к

 

т.е. функция Гамильтона, соответствующая оптимальному управлению, должна равняться нулю в конечный момент времени tк.

Важным примером задачи с нефиксированным временем является задача об оптимальном быстродействии (см. § 8.4).

Проиллюстрируем методику практического использования ПМ на следующих примерах (см. § 8.2 – 8.6).

230