Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дифференциальные уравнения.pdf
Скачиваний:
237
Добавлен:
11.05.2015
Размер:
2.38 Mб
Скачать

Данный функционал полная энергия системы традиционно называется функцией Лагранжа для рассматриваемой механической системы.

В терминах функции Лагранжа уравнение (2.5.4) перепишем в виде

L'

d

L' = 0 .

 

dt

 

x

 

x&

 

Данное дифференциальное уравнение, как нетрудно убедиться,

является

уравнением Эйлера для функционала

 

t1

 

 

 

 

ò L (t , x , x&)dt ,

(2.5.6)

t0

 

 

 

 

который для рассматриваемой механической системы по традиции называется «действие».

Таким образом, дифференциальный закон движения Ньютона (2.5.1) в

терминах вариационного принципа Гамильтона можно сформулировать следующим образом.

Когда заданы начальные и конечные состояния системы x(t0 ) = a , x(t1 ) = b , то из всех законов движения системы реализуется тот, для которого

вариация функционала «действие» (2.5.6) системы равна нулю, т.е. функционал (2.5.6) принимает минимальное значение.

§6. Задачи оптимального управления. Принцип максимума Понтрягина

Стремительное развитие технических приложений вариационного исчисления в середине двадцатого века привело к появлению нового класса задач. Их принято называть задачами оптимального управления.

Простейшей задачей оптимального управления является задача

терминального управления со свободным правым концом.

 

Пусть движение некоторого объекта описывается уравнением

 

 

x& = f (x,u,t) , t T = [t0 ,t1], x(t0 ) = x0 ,

(2.6.1)

где x

n -вектор; u r -вектор; t

скаляр; x& = dx/ dt . Относительно функции

f (x,u,t)

будем предполагать, что

она непрерывна по аргументам

вместе с

функцией f (x,u,t) / ∂x .

Допустимым управлением назовем r -мерную кусочно-непрерывную функцию u(t) , t T , принимающую значения из заданного множества U

r -мерного пространства

 

u(t) U , t T .

(2.6.2)

Каждому допустимому u(t) , t T , соответствует некоторое решение x(t) , t T , (допустимая траектория) уравнения (2.6.1). Качество процесса x(t) , t T ,

оценивается величиной

I (u) = ϕ (x (t1)) ,

(2.6.3)

где ϕ (x) – скалярная функция из класса

C (1) . Функцию (2.6.3) назовем

критерием качества процесса.

 

 

27

Сформулируем простейшую задачу оптимального управления. Среди допустимых управлений (2.6.1), (2.6.2) найти то, на котором критерий качества (2.6.3) достигает минимального значения.

Решение задачи оптимального управления (2.6.1) – (2.6.3) – управление u0 (t) , t T , – называется оптимальным управлением, траектория x0 (t) , t T ,

системы (2.6.1), соответствующая оптимальному управлению u0 (t) ,t T

оптимальной траекторией.

Поскольку критерий качества задачи определен на конечных состояниях x(t1) системы (2.6.1), простейшая задача оптимального управления (2.6.1) –

(2.6.3) часто называется задачей терминального управления, или задачей

управления конечным состоянием системы.

Наряду с системой (2.6.1) рассмотрим следующую систему дифференциальных уравнений, которую принято называть сопряженной системой:

ψ& = −

f ′( x,u ( x,ψ , t), t)

ψ , ψ (t1 )

= −

∂ϕ ( x(t1 ))

.

x

x

Система интегрируется справа налево, ее решение

вектор ψ (t) , t T

называется вектором сопряженных переменных.

 

 

 

Введем функцию

H (x,ψ ,u,t) =ψ × f (x,u,t) ,

t T ,

 

 

 

которая по традиции называется гамильтонианом системы (2.6.1). В терминах

гамильтониана сопряженная система может быть переписана в виде

 

ψ& = − H ( x 0 ,ψ , u 0 , t ) ,

ψ (t1 ) = − ∂ϕ ( x 0 (t1 )) .

 

 

 

 

 

x

 

x

 

 

 

 

Теорема

(Принцип

максимума

Понтрягина). Пусть u0 (t) ,

t T

оптимальное управление простейшей задачи (2.6.1) –

(2.6.3), x0 (t) ,

t T

оптимальная траектория, ψ 0 (t) , t T решение уравнения

 

 

 

 

ψ& = −

H (x0 ,ψ , u0 ,t)

, ψ (t1) = −

∂ϕ(x0

(t ))

.

(2.6.4)

 

x

 

1

 

 

 

x

 

 

 

Тогда выполняется условие максимума

 

 

 

 

 

 

H (x0 (t),ψ 0 (t),u0 (t),t) = max H (x0 (t),ψ 0 (t),u,t) , t T .

(2.6.5)

Отдельно

отметим,

u U

 

 

 

 

 

что, несмотря на то что оптимальное управление

u0 (t) , t T , может оказаться кусочно-непрерывной

функцией,

функция

H (t) = H (x0 (t),ψ 0 (t),u0 (t),t) непрерывна на отрезке T .

Принцип максимума является необходимым условием оптимальности. Если исключить управление u(t) из условия максимума (2.6.5), т.е. найти такую

функцию u = u(x,ψ ,t), что

H ( x,ψ , u ( x,ψ , t ), t ) = max H ( x,ψ , u , t ) ,

u U

и подставить результат в уравнения (2.6.1) и (2.6.4), то получим следующую краевую задачу для системы из 2n дифференциальных уравнений:

28

x& = f (x,u(x,ψ ,t),t) , x(t0 ) = x0 ,

ψ& = − f

(x,u(x,ψ ,t),t)

ψ ,

ψ (t1 ) = −

∂ϕ (x(t1 )) .

(2.6.6)

 

 

 

x

 

 

x

 

Согласно принципу максимума Понтрягина, если задача (2.6.1) – (2.6.3) имеет решение, то оптимальная траектория находится среди решений краевой задачи (2.6.6). В сведении задачи минимизации функционала к краевой задаче

для системы обыкновенных дифференциальных уравнений и состоит конечный результат применения принципа максимума к задаче оптимального управления.

В общем случае принцип максимума не является достаточным условием оптимальности: ему могут удовлетворять и неоптимальные управления.

Можно показать, что для многих технических приложений, моделируемых задачами оптимального управления, принцип максимума доставляет и достаточные условия оптимальности.

ИСТОРИЧЕСКАЯ СПРАВКА

Понтрягин Лев Семенович (1908 – 1988) великий советский математик. Родился 3 сентября 1908 г. в Москве. В возрасте 14 лет в результате несчастного случая потерял зрение. Окончил Московский университет (1929). С 1939 г. заведующий отделом Института математики им. В. А. Стеклова АН СССР, одновременно с 1935 г. профессор МГУ. В топологии открыл общий закон двойственности и построил теорию характеров непрерывных групп. В теории

колебаний главные результаты относятся к асимптотике релаксационных колебаний. Л. С. Понтрягин является созда- телем новой области математики математической теории оптимальных процессов, в основе которой лежит

знаменитый принцип максимума Понтрягина Математическая теория оптимальных процессов», 1961).

Лев Семенович получил фундаментальные результаты по дифференциальным играм. Работы Л. С. Понтрягина и его школы оказали очень большое

влияние на развитие теории управления и вариационного исчисления во всём мире. И пробудили большой интерес к математике в целом.

В Беларуси развитие области оптимального управления неразрывно связано с именами Р. Ф. Габасова и Ф. М. Кирилловой. Ими предложен и обоснован новый подход к решению экстремальных задач с линейным, квадратичным, нелинейным критериями качества. Это дало эффективный

выход к мощным численным процедурам построения оптимального управления, синтеза оптимального управления, стабилизации управления. А фактически к появлению нового направления, получившего название конструктивной оптимизации. Исследованы задачи управления и наблюдения в условиях неопределенности. Белорусская школа конструктивной оптимизации и управления получила признание мирового научного сообщества.

29

ИСТОРИЧЕСКАЯ СПРАВКА

Кириллова Фаина Михайловна доктор физико-математических наук (1967), профессор (1972), член-корреспондент Национальной

академии наук Беларуси по специальности «Математическая кибернетика» (1996),

заслуженный деятель науки Республики Беларусь (2002). Окончила Уральский госуниверситет (Свердловск, 1954). С 1970 г.

заведующая отделом Института математики НАН Беларуси. Фаина Михайловна стала первой в истории Беларуси женщиной- математиком, удостоенной высокого научного звания член-корреспондент НАН Беларуси.

Габасов Рафаил Федорович. Родился в

1935 г. (Магнитогорск, Россия). Рафаил Габасов окончил Уральский госуниверситет (Свердловск, 1958). Доктор физико-математических наук (1970), профессор (1971). Заслуженный деятель науки БССР (1982), член Петровской Академии Наук и Искусств (Санкт- Петербург, 1993), почетный доктор наук Иркутского государственного университета (1995). В Минске, после безвременной кончины своего наставника академика АН БССР Барбашина

Евгения Алексеевича Рафаил Габасов возглавил кафедру прикладной математики математического факультета БГУ. В 1970 г. на базе кафедры был создан факультет прикладной математики (ФПМ). Сама кафедра вошла в состав нового факультета и была переименована в кафедру методов оптимального управления (МОУ), которой Р. Ф. Габасов руководил до июля 2000 г. В настоящее время профессор кафедры МОУ ФПМИ БГУ.

§7. Функционалы от функций нескольких переменных. Постановка вариационной задачи

Выше мы рассматривали функционалы, зависящие от функций одного переменного. В большинстве приложений встречаются функционалы, зависящие от функций нескольких переменных. Ограничимся для простоты случаем функции u(x, y) двух независимых переменных.

Рассмотрим функционал вида

J (u ) =

òò

æ

y ),

u

,

u ö

(2.7.1)

ç

 

 

 

÷

 

F ç x, y, u (x,

x

 

÷dxdy .

 

 

G

è

 

 

y ø

 

На функцию

 

æ

 

u

,

u ö

, определенную

в некоторой

F ç x , y , u (x , y ),

 

 

 

÷

 

 

ç

 

x

 

 

 

÷

 

 

 

 

è

 

 

y ø

 

 

пространственной области F(×) Î W Î R3 , наложено следующее

требование:

F(×) Î C (2)(Ω) по совокупности её переменных x, y, u (x, y ),

u

,

u

. Пусть Г

x

y

 

 

 

замкнутая пространственная кривая, на которую «натянута» поверхность u(x, y). Проекция Г на плоскость OXY есть простой замкнутый контур G , ограничивающий область G R2 . Потребуем, чтобы u(x, y) была определена в

односвязной ограниченной

области G R2 , u(x, y) C (2)(G),

G R 2 по

совокупности переменных.

Граничное условие состоит в том,

что значение

функции u(x, y) задано на контуре G , ограничивающем область G . 30