- •1 РЕФЕРАТ
- •2 НОРМАТИВНЫЕ ССЫЛКИ
- •3 ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
- •4 ВВЕДЕНИЕ
- •5 ОСНОВНАЯ ЧАСТЬ
- •5.1 Постановка задачи
- •5.1.1 Задача оптимального управления
- •5.1.2 Предположения
- •5.1.3 Уравнение Беллмана
- •5.1.4 Классические характеристики уравнения Беллмана
- •5.1.5 Обобщенное решение уравнения Беллмана
- •5.1.6 Репрезентативная формула функции цены
- •5.1.7 Необходимые и достаточные условия оптимальности
- •5.1.8 Оптимальный синтез
- •5.1.9 Ослабленные предположения
- •5.1.10 Свойства гладкости функции цены
- •5.1.11 Супердифференциал функции цены
- •5.2 Анализ поставленной задачи
- •5.2.1 Алгоритм построения аппроксимации функции цены
- •5.2.2 Оценка численной аппроксимации функции цены
- •5.2.3 Алгоритм построения сеточного оптимального синтеза
- •5.3 Результаты работы
- •5.3.1 Основные функции
- •5.3.2 Примеры численного построения функции цены
- •6 ЗАКЛЮЧЕНИЕ
5 ОСНОВНАЯ ЧАСТЬ
5.1 Постановка задачи
5.1.1 Задача оптимального управления
Результаты пп.5.1.1–5.1.8 получены Н.Н.Субботиной [1]. Рассмотрим нелинейную динамическую управляемую систему
( ) |
= ( , , ), |
(5.1) |
||
|
|
|||
|
|
на фиксированном отрезке времени [0, ], фазовый вектор системы R , на управление наложены геометрические ограничения , R — компакт.
Символами Π и cl Π будем обозначать полосы в пространстве R +1:
Π = (0, ) × R , |
cl Π = [0, ] × R . |
Поставим задачу оптимального |
управления динамической системой- |
мой (5.1). Символом ( 0, ), 0 [0, ], обозначается множество всех допустимых управлений. В качестве допустимых управлений будем рассматривать измеримые функции (·) : [ 0, ] → , называемые программами.
Пусть задано начальное состояние системы ( 0) = 0, ( 0, 0) cl Π . Обо значим траекторию движения динамической системы (5.1), выходящую из началь ной точки ( 0, 0) под воздействием управления (·) ( 0, ) символом
(·) = (·; 0, 0, (·)) : [ 0, ] →R .
Качество управления (·) оценивается с помощью функционала Больца
Z
( )
( ) ( ) ( )
0, 0; (·) = ; 0, 0, (·) + , ( ), ( ) , (5.2)
0
состоящего из терминальной функции платы (·) и интегранта (·).
10
Определим оптимальный программный результат (цену) ( 0, 0) для произ вольной начальной точки ( 0, 0) cl Π следующим соотношением:
|
( 0 |
0) = (·) ( 0, ) |
( |
0 |
, |
0; |
|
(·)) |
(5.3) |
, |
inf |
|
|
|
. |
|
|||
Определение 1. Функцией цены называется отображение |
|
||||||||
: ( 0, 0) → ( 0, 0): cl Π → R. |
(5.4) |
5.1.2 Предположения
Предполагается, что входные данные задачи (5.1)–(5.2) удовлетворяют сле дующим условиям.
1. Функции ( , , ) и ( , , ) в (5.1), (5.2) определены и непрерывны на
cl Π × вместе со своими частными производными ∂ , ∂ , ∂ , ∂ , 1, .
∂ ∂ ∂ ∂
2. Выполнены условия продолжимости
‖ ( , , )‖ ≤ 1(1 + ‖ ‖),
| ( , , )| ≤ 1(1 + ‖ ‖),
∂ ( , , )
≤ 1(1 + ‖ ‖), ∂
∂ ( , , )
≤ 1(1 + ‖ ‖),
∂ ( , , )
≤ 1(1 + ‖ ‖),
∂
∂ ( , , )
≤ 1(1 + ‖ ‖)
∂
для всех 1, , 1, , ( , , ) cl Π × , где константа 1 > 0.
|
|
3 |
. Терминальная функция платы ( ) в (5.2) определена и непрерывна на |
|||||
|
|
|
|
∂ |
|
|
|
|
|
|
|
|
|
|
|||
R |
|
вместе со своими частными производными |
|
, 1, . |
||||
|
∂ |
|||||||
|
|
4 |
. Полные вектограммы скоростей ( , ) управляемой системы (5.1) |
|||||
|
|
|
( , ) = {( ( , , ), ( , , )) |
: } |
11
являются строго выпуклыми множествами при всех ( , ) cl Π .
Условие 4 |
гарантирует, что для любой точки ( 0, 0) cl Π существует |
||||||||||||||
такое управление 0(·) ( 0, ), что выполняется |
|
|
|
|
|
||||||||||
|
|
, |
inf |
|
|
, |
0; |
|
(·)) |
= |
|
, |
0; |
0 |
. |
|
( 0 |
|
0) = (·) ( 0, ) |
( |
0 |
|
|
( |
0 |
|
(·)) |
5.1.3 Уравнение Беллмана
Хорошо известно [6], что с задачей оптимального управления связана зада ча Коши для уравнения в частных производных первого порядка типа Гамиль
тона–Якоби, которое называется уравнением Беллмана. |
|
||||||||||||||
Рассмотрим гамильтониан ( , , ): R × R × R → R вида |
|
||||||||||||||
|
|
|
( |
, , |
) = [ |
|
|
|
] |
(5.5) |
|||||
|
|
|
|
min |
|
, ( , , ) + ( , , ) , |
|
||||||||
символ ·, · означает скалярное произведение векторов. |
|
||||||||||||||
Уравнение Беллмана имеет вид |
|
|
|
|
|
|
|||||||||
|
|
∂ ( , ) |
|
( , , ( , )) |
|
( , ) Π , |
(5.6) |
||||||||
|
|
|
|
|
|
+ |
= 0, |
||||||||
|
|
∂ |
|
|
|
||||||||||
где ( , ) = (∂ ∂( 1 |
), . . . , |
∂( |
)), и выполняется краевое условие |
|
|||||||||||
|
|
, |
|
|
|
|
∂ , |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
( , ) = ( ), |
R . |
(5.7) |
5.1.4 Классические характеристики уравнения Беллмана
Введем в рассмотрение на отрезке [ 0, ] гамильтонову систему обыкновенных
дифференциальных уравнений |
|
|
|
|
||
|
= ( , , ), |
|
||||
|
|
|
̂ |
|
|
|
̂ |
|
|
(5.8) |
|||
|
|
= |
|
( , , ), |
||
|
|
|
− |
̂ |
̂ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
̂ |
|
|
|
|
|
= , ( ̂, ̂, ) − ( , , ), |
||||||
|
|
|
|
̂ |
|
|
|
|
|
|
|
|
|
|
|
|
|
̂ |
|
|
|
̂ |
|
̂ ̂ |
̂ ̂ |
||
|
̂ |
12
с граничными условиями |
|
|
|
||
̂( ) = , ̂( , ) = ( ), ̂( ) = ( ), |
R . |
(5.9) |
|||
Определение 2. Решения |
(·), (·), (·) |
системы (5.8) называются характери |
|||
стиками уравнения |
Беллмана в задаче Коши (5.6)—(5.7). |
|
|
||
|
(̂ ̂ ̂ |
) |
|
|
Как известно [10], когда у задачи Коши (5.6), (5.7) существует гладкое ре шение, оно может быть получено согласно классическому методу характеристик Коши по формуле
( , ) = ̂( , ), |
: ̂( , ) = . |
При условиях 1– 4 классическое решение задачи не всегда существует. Поэтому в дальнейшем будет введено понятие обобщенного (минимаксного или вязкост ного) решения [14] и для его построения будет использован обобщенный метод характеристик [1].
5.1.5 Обобщенное решение уравнения Беллмана
Напомним одно из определений минимаксного решения [14].
Определение 3. Функция : cl Π → R называется минимаксным решением задачи (5.6), (5.7), если она удовлетворяет краевому условию (5.7) и для любых
( 0, 0, 0) gr и R существует некоторое число ( 0, ) и липшицевые функции
( (·), (·)): [0, ] → R × R,
которые удовлетворяют начальному условию ( ( 0), ( 0)) = ( 0, 0), уравнению
˙( ) = ˙( ), − ( , ( ), )
при почти всех [ 0, ] и неравенству ( ) ≥ ( , ( )) при почти всех [ 0, ].
13