Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Северо-Восточный федеральный университет им. М.К. Аммосова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

оту шпоры(beta).doc

Скачиваний:

Добавлен:

23.12.2018

Размер:

3.2 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем

Управление u(t) у нас кусочно-непрерывно, x(t), ψ(t) – непрерывны по t. Поэтому в общем случае функция Гамильтона кусочно-непрерывна по t. Оказывается, если управление удовлетворяет принципу максимума, то функция Гамильтона непрерывна и даже кусочно-дифференцируема по t вдоль всех процессов, подозрительных на оптимальность. Таким образом, вдоль оптимального процесса функция Гамильтона обладает повышенной гладкостью.

Теорема 13.3. Пусть вектор-функция f(x, u, t), задающая правую часть системы, непрерывна по своим аргументам вместе с частными производными по x - ∂f/∂x и по t - ∂f/∂t.

Если допустимое управление u(t) удовлетворяет принципу максимума, то функция Гамильтона M(t)=H(x(t), ψ(t), u(t), t),

вдоль этого управления является непрерывной и кусочно-дифференцируемой функцией времени на [t₀, t₁]. Причем, в точках непрерывности управления u(t), производная dM/dt существует и равна.(Функция Гамильтона дифференцируема во всех точках непрерывности управления).

Доказательство: Рассмотрим приращение M(t) в некоторой произвольной точке

t₀ ≤ t ≤ t₁.

ΔM(t)=M(t+Δt)-M(t)=H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt)-H(x(t), ψ(t), u(t), t)=H[t+Δt]-H[t].

Т.к. u(t) удовлетворяет принципу максимума, то имеет место неравенствоH[t+Δt] ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt),

(по сравнению, с какими угодно управлениями и в частности, по сравнению с u(t)). АналогичноH[t] ≥ H(x(t), ψ(t), u(t+Δt), t). Произведем оценку приращения ΔM(t) ΔM(t) ≤ H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt) - H(x(t), ψ(t), u(t+Δt), t)=A(Δt).

Управление никакого приращения не получает. С другой стороны ΔM(t) ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt) - H(x(t), ψ(t), u(t), t)=В(Δt). Таким образом имеем оценку B(Δt) ≤ ΔM(t) ≤ A(Δ (13.4.1)

Перейдем к пределу при Δt→0. Т.к. вектор-функции x(t), ψ(t) непрерывны по t, а функция Гамильтона непрерывна по своим аргументам, то при Δt→0, A(Δt)→0, B(Δt)→0. В A(Δt), B(Δt) управление приращения не получает. Отсюда следует: ΔM(t)→0, что и доказывает непрерывность функции M(t).

Докажем дифференцируемость. Пусть t точка дифференцируемости управления u(t). Т.е.u(t+Δt)=u(t).

Тогда x(t), ψ(t) будут являться дифференцируемыми в точке t, т.е. их производные в этой точке будут являться непрерывными. Тогда в этой точке производные существуют и непрерывны. Поделим неравенство (13.4.1) на приращение Δt (Δt – произвольное приращение)..

Если Δt<0, то неравенство переменится. Будет иметь противоположный смысл при Δt<0.

Пусть Δt→0 и рассмотрим, как ведут себя эти отношения. Тогда .

∂H/∂x существует, поскольку существует ∂f/∂x ; ∂H/∂t существует, т.к. существует ∂f/∂t .

Эти производные существуют и непрерывны.

Следовательно, . существует и равен ∂H/∂t. .

Таким образом, вдоль управления, удовлетворяющего принципу максимума.

Следствие 1. Пусть исходная система является стационарной (правые части явно от времени не зависят):

=f(x, u). В этом случае H = H(x, ψ, u), также явно от t не зависит. Следовательно, вдоль управления, удовлетворяющего принципу максимума . Отсюда, учитывая непрерывность H по времени, получаем

H(x(t), ψ(t), u(t)) ≡ C, для любых t₀ ≤ t ≤ t₁. Из механики известно, что если система дифференциальных уравнений описывает механическую систему, то функция Гамильтона Н описывает полную энергию. Это свойство равносильно закону сохранения энергии.

Теорема 13.4. Для оптимальности допустимого управления u(t) в задаче оптимального управления, линейной по фазовым переменным

=A(t) x + b(u, t), (13.4.2)

x(t₀) = x₀, u(t)U, t₀ ≤ t ≤ t₁. (13.4.3)

J(u) = (x(t₁)) → min, (13.4.4)

где (x) выпуклая функция, необходимо и достаточно, чтобы оно удовлетворяло принципу максимума.

Рассмотрим следующую линейную задачу:

=A(t)x + B(t)u + W(t), x(t₀)=x⁰, u(t)U, t₀ ≤ t ≤ t₁. J(u) = x(t₁) → min,

C – заданный n-мерный вектор.

Для этой задачи в силу теоремы 13.4 принцип максимума есть необходимое и достаточное условие оптимальности. Найдем управление, удовлетворяющее принципу максимума в сформулированной задаче.

H=ψ(t)’x +ψ’B(t)u +ψ’W(t).

Сопряженная система (13.4.5)

Сопряженная система (13.5.5) не зависит от выбора управления u и является замкнутой. Найдем управление, удовлетворяющее принципу максимума. Это управление и будет являться оптимальным управлением. Чтобы найти максимум нужно максимизировать линейную форму по u.B(t)u* = B(t)u, t₀ ≤ t ≤ t₁. (13.4.6) Таким образом, оптимальное управление для сформулированной линейной задачи определяется из условия (13.4.6), где ψ=ψ(t) есть решение сопряженной системы (13.4.5).

49.

17.Пусть система описывается уравнениями вида (2.9.1), (2.9.8). Формально передаточная функция этой системы определяется из соотношения (2.9.8) путем подстановки в него W (р) вместо у, и 1 вместо и. Из полученного уравнения Q(p)-W (р) = R (р) легко определить

(2.11.1)

Выражение (2.11.1) формально определяет передаточную функцию стационарной линейной системы, поведение которой описывается дифференциальными уравнениями (2.9.8), при всех значениях р, кроме совпадающих с корнями характеристического уравнения системы

(2.11.2)

Однако физически эта передаточная функция существует не при всех значениях р. В общем случае реакция системы на показательное возмущение представляет собой полное решение уравнения (2.9.8), а не частное. Для получения полного решения уравнения (2.9.8) следует к найденному частному решению добавить общее решение соответствующего однородного дифференциального уравнения

(2.11.3)

Из теории дифференциальных уравнений известно, что если корни характеристического уравнения (2.11.2) v,...,v_n все различны, то общее решение уравнения (2.11.3) представляет собой линейную комбинацию показательных функций с произвольными коэффициентами. Если некоторые корни характеристического уравнения совпадают, например , то функции заменяются функциями . Таким образом, в случае, когда характеристическое уравнение не имеет кратных корней, общее решение уравнения (2.9.8) определяется формулой

(2.11.4)

Для определения передаточной функции системы разделим (2.11.4) на e^pt :

(2.11.5)

Если действительные части всех разностей отрицательны, то все показательные функции в (2.11.5) стремятся к 0 при . В этом случае передаточная функция системы, представляющая собой отношение реакции этой системы на бесконечно долго действующее на нее возмущение е^р^t к самому возмущению е^р^t, определяется формулой (2.11.1). Если хотя бы одно из чисел имеет положительную действительную часть, то соответствующая показательная функция в (2.11.4) неограниченно возрастает при , и, следовательно, передаточная функция системы не существует.

Таким образом, передаточная функция стационарной линейной системы, описываемой дифференциальным уравнением (2.9.8) существует только в области значений р, действительные части которых больше действительных частей всех корней характеристического уравнения (рис.2.5).

Рис.2.5 - Область существования передаточной функции

Очевидно, что частотная характеристика, представляющая собой значение передаточной функции на мнимой оси , существует для рассматриваемой системы только в том случае, когда действительные части всех корней характеристической: уравнения отрицательны. В дальнейшем мы увидим, что эт условие необходимо и достаточно для устойчивости стационар ной линейной системы.

Все виды динамических характеристик линейных систем (дифференциальное уравнение, передаточная функция, частотные характеристики, весовая (импульсная переходная) функция, переходная функция) связаны между собой определенными зависимостями и эквивалентны друг другу в определении динамических свойств системы, поэтому изложенного выше вполне достаточно для изучения динамических свойств звеньев линейных САУ, описываемых дифференциальными уравнениями.

Основные формы записи дифференциальных уравнений для линейных САУ

Стационарные линейные непрерывные САУ наиболее часто описываются линейными дифференциальными уравнениями с постоянными коэффициентами:

(2.9.1)

где у – выходная переменная (управляемая (регулируемая) величина) САУ, u – входная переменная САУ. Правая часть уравнения (2.9.1) записана относительно управляющего воздействия u, однако используются формы записи уравнения относительно задающего воздействия g, возмущения или нескольких входных воздействий. Применяется также операторная форма записи уравнения (2.9.1):

(2.9.2)

где р – оператор дифференцирования . Заметим, что по сложившейся традиции символ «р» используется также в преобразованиях Лапласа и Карсона-Хевисайда, но является комплексным числом . Краткая справка об операционном методе приведена в разделе 3.

За многолетнюю историю развития ТАУ сложились традиции формальной записи линейных дифференциальных уравнений, описывающих стационарные САУ. В учебной литературе по ТАУ они рассматриваются как стандартные формы записи дифференциальных уравнений. Рассмотрим эти формы записи на примере линейной системы второго порядка:

(2.9.3)

или в операторной форме

(2.9.4)

Первая стандартная символическая форма записи уравнения (2.9.3) имеет следующий вид:

(2.9.5)

где

Форма (2.9.5) представляет собой операторно-структурное описание системы, т.е. в виде операторов звеньев, составляющих структурную схему системы (далее эти понятия разъясняются), и связей между ними. В этой форме Т - постоянные времени звена, измеряемые в секундах; k – передаточный коэффициент звена.

Из изложенного выше следует, что уравнение (2.9.1) в этой форме перепишется в следующем виде:

(2.9.6)

где Во второй стандартной форме записи дифференциального уравнения используется передаточная функция системы, которая для рассматриваемого примера (2.9.3) имеет вид

Передаточная функция САУ, поведение которой во времени описывается уравнением (2.9.1), имеет следующий вид :

(2.9.7)

В формуле (2.9.7) через Y(p) и U(p) обозначены изображения (по Лапласу) выходной и входной переменных САУ при нулевых начальных условиях и равенстве нулю внешних возмущений, а через R(p) и Q(p) полиномы относительно комплексной переменной р.

Вторая стандартная форма записи дифференциального уравнения имеет следующий вид:

(2.9.8)

В (2.9.8) R(p) и Q(p)являются полиномами (символическими) относительно оператора р.

Из сравнения первой и второй стандартных форм записи дифференциальных уравнений следует, что с математической точки зрения различие между этими формами весьма несущественно и состоит лишь в различном представлении коэффициентов уравнений. В ТАУ принято называть уравнения вида (2.9.1)-(2.9.6), (2.9.8) уравнениями типа «вход-выход».

Третья стандартная форма записи дифференциального уравнения принципиально отличается от форм записи, описанных выше. В этой форме записи используются переменные состояния. Отметим, что понятие «состояние» является базовым в современной ТАУ (СТАУ). Переменные состояния – это промежуточные переменные системы (рис.2.4), число которых равно ее порядку n. В общем случае u и выходные у переменные могут быть векторными величинами размерности m и l соответственно.

Рис.2.4 – Состояние системы

Переменные состояния называют также координатами состояния, так как их совокупность задает вектор состояния .

Множество возможных положений этого вектора образует векторное пространство Х, называемое пространством состояний системы. В переменных состояния САУ описывается векторно-матричным уравнением

(2.9.9)

где - квадратная матрица коэффициентов (ее называют также собственной параметрической матрицей системы); – входная матрица (матрица управления) системы; – выходная матрица системы; – вектор переменных состояния внутренних координат системы; – вектор входных переменных (управляющих и возмущающих); – вектор наблюдаемых или выходных переменных; размерности матриц А, В, С соответственно .

Процессы в САУ в свободном движении (без внешних воздействий) согласно уравнению (2.9.9) описываются векторно-матричным уравнением с характеристическим уравнением , где Е - единичная матрица, или в развернутом виде системой дифференциальных уравнений

с характеристическим уравнением

(2.9.10)

Эти уравнения при определенных начальных условиях дают возможность изучить процессы в системе путем их решения численными методами с использованием ЭВМ.

Разработаны различные способы перехода от уравнений типа «вход-выход» к уравнениям состояния вида (2.9.9) и наоборот. Один из наиболее распространенных способов состоит в следующем. Пусть САУ описывается уравнением (2.9.1). Введем обозначения

С помощью этих обозначений преобразуем уравнение (2.9.1) к следующему виду:

(2.9.11) где

В нашем примере у и и₁ являются скалярными величинами. В общем случае (2.9.9) - это, соответственно, вектор наблюдаемых или выходных переменных и вектор входных переменных (управляющих и возмущающих), поэтому в (2.9.11) матрицы В и С выродились в вектор-столбец и вектор-строку соответственно.

Система уравнений (2.9.11) представляет собой описание линейной непрерывной системы в пространстве состояний . Уравнения (2.9.11) с матрицей называют уравнениями в форме Фробениуса.

Если , то

Форма уравнений (2.9.11) с подобными матрицами и В называется в ТАУ канонической формой фазовой переменной.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.201558.37 Кб66Ответы ПР-в бизнесе и гос. структуре.doc
#
17.09.201939.58 Кб6Ответы стилистика.docx
#
18.09.2019125.14 Кб18ответы теор.грама.docx
#
01.04.201549.66 Кб518Ответы Тест ПР-кампания.doc
#
22.09.2019847.36 Кб5Отраслевой дорожный методический документ.doc
#
23.12.20183.2 Mб36оту шпоры(beta).doc
#
22.12.2018380.84 Кб38ОТу экзмен ответ.docx
#
01.04.20153.44 Mб56отчет .docx
#
18.09.20199.62 Mб1Отчет о практике 12 .docx
#
20.11.201929.12 Кб2Отчет о прохождении практик 2012.docx
#
01.04.20151.72 Mб76отчет по буровой практике.docx