Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
оту шпоры(beta).doc
Скачиваний:
36
Добавлен:
23.12.2018
Размер:
3.2 Mб
Скачать

48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем

Управление u(t) у нас кусочно-непрерывно, x(t), ψ(t) – непрерывны по t. Поэтому в общем случае функция Гамильтона кусочно-непрерывна по t. Оказывается, если управление удовлетворяет принципу максимума, то функция Гамильтона непрерывна и даже кусочно-дифференцируема по t вдоль всех процессов, подозрительных на оптимальность. Таким образом, вдоль оптимального процесса функция Гамильтона обладает повышенной гладкостью.

Теорема 13.3. Пусть вектор-функция f(x, u, t), задающая правую часть системы, непрерывна по своим аргументам вместе с частными производными по x - ∂f/∂x и по t - ∂f/∂t.

Если допустимое управление u(t) удовлетворяет принципу максимума, то функция Гамильтона M(t)=H(x(t), ψ(t), u(t), t),

вдоль этого управления является непрерывной и кусочно-дифференцируемой функцией времени на [t0, t1]. Причем, в точках непрерывности управления u(t), производная dM/dt существует и равна.(Функция Гамильтона дифференцируема во всех точках непрерывности управления).

Доказательство: Рассмотрим приращение M(t) в некоторой произвольной точке

t0 ≤ t ≤ t1.

ΔM(t)=M(t+Δt)-M(t)=H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt)-H(x(t), ψ(t), u(t), t)=H[t+Δt]-H[t].

Т.к. u(t) удовлетворяет принципу максимума, то имеет место неравенствоH[t+Δt] ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt),

(по сравнению, с какими угодно управлениями и в частности, по сравнению с u(t)). АналогичноH[t] ≥ H(x(t), ψ(t), u(t+Δt), t). Произведем оценку приращения ΔM(t) ΔM(t) ≤ H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt) - H(x(t), ψ(t), u(t+Δt), t)=A(Δt).

Управление никакого приращения не получает. С другой стороны ΔM(t) ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt) - H(x(t), ψ(t), u(t), t)=В(Δt). Таким образом имеем оценку B(Δt) ≤ ΔM(t) ≤ A(Δ (13.4.1)

Перейдем к пределу при Δt→0. Т.к. вектор-функции x(t), ψ(t) непрерывны по t, а функция Гамильтона непрерывна по своим аргументам, то при Δt→0, A(Δt)→0, B(Δt)→0. В A(Δt), B(Δt) управление приращения не получает. Отсюда следует: ΔM(t)→0, что и доказывает непрерывность функции M(t).

Докажем дифференцируемость. Пусть t точка дифференцируемости управления u(t). Т.е.u(t+Δt)=u(t).

Тогда x(t), ψ(t) будут являться дифференцируемыми в точке t, т.е. их производные в этой точке будут являться непрерывными. Тогда в этой точке производные существуют и непрерывны. Поделим неравенство (13.4.1) на приращение Δt (Δt – произвольное приращение)..

Если Δt<0, то неравенство переменится. Будет иметь противоположный смысл при Δt<0.

Пусть Δt→0 и рассмотрим, как ведут себя эти отношения. Тогда .

H/∂x существует, поскольку существует ∂f/∂x ; ∂H/∂t существует, т.к. существует ∂f/∂t .

Эти производные существуют и непрерывны.

Следовательно, . существует и равен ∂H/∂t. .

Таким образом, вдоль управления, удовлетворяющего принципу максимума.

Следствие 1. Пусть исходная система является стационарной (правые части явно от времени не зависят):

=f(x, u). В этом случае H = H(x, ψ, u), также явно от t не зависит. Следовательно, вдоль управления, удовлетворяющего принципу максимума . Отсюда, учитывая непрерывность H по времени, получаем

H(x(t), ψ(t), u(t)) ≡ C, для любых t0tt1. Из механики известно, что если система дифференциальных уравнений описывает механическую систему, то функция Гамильтона Н описывает полную энергию. Это свойство равносильно закону сохранения энергии.

Теорема 13.4. Для оптимальности допустимого управления u(t) в задаче оптимального управления, линейной по фазовым переменным

=A(t) x + b(u, t), (13.4.2)

x(t0) = x0, u(t)U, t0 ≤ t ≤ t1. (13.4.3)

J(u) = (x(t1)) → min, (13.4.4)

где (x) выпуклая функция, необходимо и достаточно, чтобы оно удовлетворяло принципу максимума.

Рассмотрим следующую линейную задачу:

=A(t)x + B(t)u + W(t), x(t0)=x0, u(t)U, t0tt1. J(u) = x(t1) → min,

C – заданный n-мерный вектор.

Для этой задачи в силу теоремы 13.4 принцип максимума есть необходимое и достаточное условие оптимальности. Найдем управление, удовлетворяющее принципу максимума в сформулированной задаче.

H=ψ(t)’x +ψ’B(t)u +ψ’W(t).

Сопряженная система (13.4.5)

Сопряженная система (13.5.5) не зависит от выбора управления u и является замкнутой. Найдем управление, удовлетворяющее принципу максимума. Это управление и будет являться оптимальным управлением. Чтобы найти максимум нужно максимизировать линейную форму по u.B(t)u* = B(t)u, t0tt1. (13.4.6) Таким образом, оптимальное управление для сформулированной линейной задачи определяется из условия (13.4.6), где ψ=ψ(t) есть решение сопряженной системы (13.4.5).

49.

17.Пусть система описывается уравнениями вида (2.9.1), (2.9.8). Формально передаточная функция этой системы опреде­ляется из соотношения (2.9.8) путем подстановки в него W (р) вместо у, и 1 вместо и. Из полученного уравнения Q(p)-W (р) = R (р) легко определить

(2.11.1)

Выражение (2.11.1) формально определяет передаточную функцию стационарной линейной системы, поведение которой описывается дифференциальными уравнениями (2.9.8), при всех значениях р, кроме совпадающих с корнями характеристиче­ского уравнения системы

(2.11.2)

Однако физически эта передаточная функция существует не при всех значениях р. В общем случае реакция системы на показательное возмущение представляет собой полное решение уравнения (2.9.8), а не частное. Для получения полного решения уравнения (2.9.8) следует к найденному частному решению доба­вить общее решение соответствующего однородного диффе­ренциального уравнения

(2.11.3)

Из теории дифференциальных уравнений известно, что ес­ли корни характеристического уравнения (2.11.2) v,...,vn все различны, то общее решение уравнения (2.11.3) представляет собой линейную комбинацию показательных функций с произвольными коэффициентами. Если некоторые корни харак­теристического уравнения совпадают, например , то функции заменяются функциями . Таким образом, в случае, когда харак­теристическое уравнение не имеет кратных корней, общее ре­шение уравнения (2.9.8) определяется формулой

(2.11.4)

Для определения передаточной функции системы разделим (2.11.4) на ept :

(2.11.5)

Если действительные части всех разностей отрицательны, то все показательные функции в (2.11.5) стремятся к 0 при . В этом случае передаточная функция системы, представляющая собой отношение реакции этой системы на бесконечно долго действующее на нее возмущение ерt к самому возмущению ерt, определяется формулой (2.11.1). Если хотя бы одно из чисел имеет по­ложительную действительную часть, то соответствующая пока­зательная функция в (2.11.4) неограниченно возрастает при , и, следовательно, передаточная функция системы не су­ществует.

Таким образом, передаточная функция стационарной линей­ной системы, описываемой дифференциальным уравнени­ем (2.9.8) существует только в области значений р, действи­тельные части которых больше действительных частей всех корней характеристического уравнения (рис.2.5).

Рис.2.5 - Область существования передаточной функции

Очевидно, что частотная характеристика, представляющая собой значение передаточной функции на мнимой оси , существует для рассматриваемой системы только в том случае, когда действительные части всех корней характеристической: уравнения отрицательны. В дальнейшем мы увидим, что эт условие необходимо и достаточно для устойчивости стационар ной линейной системы.

Все виды динамических характеристик линейных систем (дифференциальное уравнение, передаточная функция, частот­ные характеристики, весовая (импульсная переходная) функция, переходная функция) связаны между собой определенными за­висимостями и эквивалентны друг другу в определении динами­ческих свойств системы, поэтому изложенного выше вполне до­статочно для изучения динамических свойств звеньев линейных САУ, описываемых дифференциальными уравнениями.

Основные формы записи дифференциальных уравнений для линейных САУ

Стационарные линейные непрерывные САУ наиболее часто описываются линейными дифференциальными уравнениями с постоянными коэффициентами:

(2.9.1)

где у – выходная переменная (управляемая (регулируемая) величина) САУ, u – входная переменная САУ. Правая часть уравнения (2.9.1) записана относительно управ­ляющего воздействия u, однако используются формы записи уравнения относительно задающего воздействия g, возмущения или нескольких входных воздействий. Применяется также операторная форма записи уравнения (2.9.1):

(2.9.2)

где р – оператор диффе­ренцирования . Заметим, что по сложившейся традиции символ «р» используется также в преобразованиях Лапласа и Карсона-Хевисайда, но является комплексным числом . Краткая справка об операционном методе приведена в разделе 3.

За многолетнюю историю развития ТАУ сложились тради­ции формальной записи линейных дифференциальных уравне­ний, описывающих стационарные САУ. В учебной литературе по ТАУ они рассматриваются как стандартные формы записи дифференциальных уравнений. Рассмотрим эти формы записи на примере линейной системы второго порядка:

(2.9.3)

или в операторной форме

(2.9.4)

Первая стандартная символическая форма записи урав­нения (2.9.3) имеет следующий вид:

(2.9.5)

где

Форма (2.9.5) представляет собой операторно-структурное описание системы, т.е. в виде операторов звеньев, составляю­щих структурную схему системы (далее эти понятия разъясня­ются), и связей между ними. В этой форме Т - постоянные вре­мени звена, измеряемые в секундах; k – передаточный коэффи­циент звена.

Из изложенного выше следует, что уравнение (2.9.1) в этой форме перепишется в следующем виде:

(2.9.6)

где Во второй стандартной форме записи дифференциально­го уравнения используется передаточная функция системы, ко­торая для рассматриваемого примера (2.9.3) имеет вид

Передаточная функция САУ, поведение которой во времени описывается уравнением (2.9.1), имеет следующий вид :

(2.9.7)

В формуле (2.9.7) через Y(p) и U(p) обозначены изображения (по Лапласу) выходной и входной переменных САУ при нулевых начальных условиях и равенстве нулю внешних возмущений, а через R(p) и Q(p) полиномы относительно комплексной переменной р.

Вторая стандартная форма записи дифференциального уравнения имеет следующий вид:

(2.9.8)

В (2.9.8) R(p) и Q(p)являются полиномами (символическими) относительно оператора р.

Из сравнения первой и второй стандартных форм записи дифференциальных уравнений следует, что с математической точки зрения различие между этими формами весьма несущественно и состоит лишь в различном представлении коэффициентов уравнений. В ТАУ принято называть уравнения вида (2.9.1)-(2.9.6), (2.9.8) уравнениями типа «вход-выход».

Третья стандартная форма записи дифференциального уравнения принципиально отличается от форм записи, описанных выше. В этой форме записи используются переменные состояния. Отметим, что понятие «состояние» является базовым в современной ТАУ (СТАУ). Переменные состояния – это промежуточные переменные системы (рис.2.4), число которых равно ее порядку n. В общем случае u и выходные у переменные могут быть векторными величинами размерности m и l соответственно.

Рис.2.4 – Состояние системы

Переменные состояния называют также координатами состояния, так как их совокупность задает вектор состояния .

Множество возможных положений этого вектора образует векторное пространство Х, называемое пространством состояний системы. В переменных состояния САУ описывается векторно-матричным уравнением

(2.9.9)

где - квадратная матрица коэффициентов (ее называют также собственной параметрической матрицей системы); – входная матрица (матрица управления) системы; – выходная матрица системы; – вектор переменных состояния внутренних координат системы; – вектор входных переменных (управляющих и возмущающих); – вектор наблюдаемых или выходных переменных; размерности матриц А, В, С соответственно .

Процессы в САУ в свободном движении (без внешних воздействий) согласно уравнению (2.9.9) описываются векторно-матричным уравнением с характеристическим уравнени­ем , где Е - единичная матрица, или в раз­вернутом виде системой дифференциальных уравнений

с характеристическим уравнением

(2.9.10)

Эти уравнения при определенных начальных условиях дают возможность изучить процессы в системе путем их решения чис­ленными методами с использованием ЭВМ.

Разработаны различные способы перехода от уравнений типа «вход-выход» к уравнениям состояния вида (2.9.9) и наобо­рот. Один из наиболее распространенных способов состоит в следующем. Пусть САУ описывается уравнением (2.9.1). Введем обозначения

С помощью этих обозначений преобразуем уравнение (2.9.1) к следующему виду:

(2.9.11) где

В нашем примере у и и1 являются скалярными величина­ми. В общем случае (2.9.9) - это, соответственно, вектор наблю­даемых или выходных переменных и вектор входных перемен­ных (управляющих и возмущающих), поэтому в (2.9.11) матрицы В и С выродились в вектор-столбец и вектор-строку соответст­венно.

Система уравнений (2.9.11) представляет собой описание ли­нейной непрерывной системы в пространстве состояний . Уравнения (2.9.11) с матрицей называют уравнениями в форме Фробениуса.

Если , то

Форма уравнений (2.9.11) с подобными матрицами и В называется в ТАУ канонической формой фазовой переменной.