Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5.Управление непрерывными динамическими ТП.doc
Скачиваний:
23
Добавлен:
02.06.2015
Размер:
1.39 Mб
Скачать

Решение задач акр с помощью метода Эйлера-Лагранжа

Для функционала при уравнениях связи,составляется функционал

,

к которому применяются уравнения Эйлера по переменным и.

Рассмотрим пример решения задачи АКР для колебательного звена:

Как известно из ТАУ при – апериодический процесс,– неза­тухающие колебания.

Имеем колебательное звено

.

Запишем дифференциальное уравнение второго порядка в виде системы двух уравнений первого порядка, для чего введем переменные,, тогда. Итак имеем систему:

, (4) которой соответствует структура:

и функционал

.

Граничные условия:

,

, . Требуется найти

Решение:

  1. Составляется уравнение Лагранжа

Подставив во второе уравнение системы (4) получаем следующую систему уравнений с неизвестными,,,:

, (5)

Характеристический определитель системы (5):

, (6)

Обозначим ,. С учетом введенных обозначений, характеристическое уравнение запишется:

.

Решаем его обозначая :

Случай 1.

Пусть . Если, то все корни исходного характеристического уравнения чисто мнимые и оптимальный регулятор не существует. Если, то корни будут иметь вид:

В общем виде решением системы (5) будет

,

причем в силу граничных условий. Из уравненияполучим решение для:

.

Далее, исключаем время из решения для синтеза регулятора. Получим:

,

подставляя которые в уравнение для находим:

.

Из второго уравнения системы (4) находится уравнение оптимального регулятора

.

Случай 2.

Пусть . Тогда корни характеристического уравнения (6) будут комплексными:

, ,

где ,.

В общем случае решение системы (5) для этого случая:

,

причем, в силу граничных условий .

Выразив производную через переменныеи:

,

из второго уравнения системы (4) получим уравнение оптимального регулятора:

Таким образом, для оптимизации по квадратичному критерию колебательного звена необходимо замкнуть его отрицательной обратной связью по выходным координатам с коэффициентами соответственно и.

Структурная схема замкнутой системы:

Отметим, что от выбора весовых коэффициентов в функционале зависит характер переходного процесса в системе. Процесс может быть колебательным или монотонным, иметь различное перерегулирование и т.д. Если найти в общем виде уравнение для функционала в зависимости от весовых коэффициентов, то можно провести минимизацию функционала по параметрам, в качестве которых выступают коэффициенты штрафа.

Решение неклассических задач вариационного исчисления

Неклассическими задачами ВИ считаются такие, в которых накладываются ограничения в виде неравенств на переменные системы и управления, что всегда встречается в технических задачах. Рассмотрим основной метод их решения, получивший название принцип максимума. Этот аппарат разработан в середине 50-х годов XXвека коллективом отечественных ученых под руководством Понтрягина Л.С. За разработку коллектив получил Ленинскую премию. С тех пор метод продолжает развиваться.

Принцип максимума

Постановка задачи.

Пусть объект управления описывается системой уравнений

, , (1)

или в векторной форме

,

где – вектор координат состояния,– вектор управлений.

Полагаем, что функции непрерывны по всем аргументам и имеют непрерывные частные производные по. На переменные системы и управления наложены ограничения,(это первое отличие от классического вариационного исчисления).

Назовем допустимыми управлениями такие управления , которые являются кусочно-непрерывными функциями времени и принимают значения из области. (Кусочная непрерывность – это второе отличие). Кусочная непрерывность означает, что имеем негладкую функцию, но она непрерывна подляв силу того, чтонепрерывны.

Для управлений же функции могут иметь разрывы.

Задача формулируется следующим образом: среди допустимых управлений, переводящих систему в пространстве из начального положенияв конечное положение, если эти управления существуют, требуется найти такое управление, для которого функционал

(2)

достигает минимума.

Идея метода.

Введем в рассмотрение новую координату состояния , удовлетворяющую дифференциальному уравнению

, (3)

которое учитывает подынтегральную функцию в функционале (2). Присоединив уравнение (3) к системе (1) получим систему уравнений:

, , (4)

Запишем систему (4) в векторной форме, для чего введем в рассмотрение (n+1)-мерный вектор координат состояния. Тогда в векторной форме система уравнений (4) примет вид:

, (5)

где – вектор правых частей системы (4), причем правые части не зависят от координаты.

Обозначим в (n+1)-мерном пространстве состояний черезточку с координатами. Пусть– некоторое допустимое управление, для которого соответствующая фазовая траектория системы (1) проходит причерез точку, а при– через точку. Из уравнения (3) следует, что координата

.

При эта координата

Таким образом, в пространстве фазовая траекториясистемы (5) при этом управлении проходит причерез точку, а причерез точку. Тогда задачу оптимального управления можно сформулировать так:

Для системы следует выбрать такое управление, чтобы координатапринимала бы наименьшее значение, т.к. подразумевается, что отыскивается минимум функционала.

Доказательство метода сводится к доказательству некоторых утверждений:

  1. Утверждается принцип оптимальности, что каждый отрезок оптимальной траектории является оптимальным. На основе его показывается, что все неоптимальные траектории проходят выше оптимальной. Если какая-то траектория проходит ниже выбранной, то ее нужно считать за оптимальную. Далее задаются вариации траекторий при воздействии различных вариаций управления. Считается, что найдено оптимальное управление, соответствующее оптимальной траектории.

  2. Задается временная вариация управления в течение времени , в конце управления.

Frame3

Доказывается, что остаток Rвариации траектории является малым, а движение при временной вариации будет проходить по касательной в конечной точке (вектор).

  1. Задается игольчатая вариация управления (вариация Макшейна).

Эта вариация ограничена. Если, то площадь импульса также, при этом следует ожидать малого отклонения варьированной траектории от оптимальной.

В принципе максимума доказывается, что варьированные траектории будут выше оптимальной и они получаются путем сдвига оптимальной траектории на величину .

.

Дается множество игольчатых вариаций, от каждой вариации получается вектор смещения . Все векторы смещения переносятся в конечную точку. На векторы смещения натягивается оболочка – получается конус векторов смещения.

4. Полученный конус векторов смещения от игольчатых вариацийрастягивается по направлению вектораот временной вариации. Полученный конусне заполняет всего (n+1)-мерного пространства. Т.к. конус построен на вариациях, то оптимальная траектория не попадает в этот конус. Раз так, то этот конус можно отделить от траектории некоторой плоскостью. Эту плоскость характеризует вектор, нормальный к плоскости. Вектор жележит в этой плоскости, т.е они перпендикулярны и их скалярное произведение равно нулю. С учетом, получим:

.

В ПМ также доказывается, что векторы иперемещаются вдоль траектории и всегда перпендикулярны, т.е. их скалярное произведение должно быть равно 0.

Определение вспомогательной вектор-функции .

Стоит задача – выразить функцию через уравнения связи.

  1. Запишем неоптимальную траекторию через оптимальную и вариацию.

и подставим в уравнение связи.

, (*)

записывается без вариации , т.к. в ПМ доказывается, чтоприна порядок ниже, чем вызванная им вариация.

Разложим правую часть уравнения (*) в ряд Тейлора и воспользуемся только линейной частью разложения:

, (**)

где в (n+1)-мерном пространстве,вn-мерном пространстве.

  1. Потребуем, чтобы скалярное произведение векторов

, (***)

вдоль описанной траектории. Из ПМ было видно, что , поэтому условие (***) более слабое, чем равенство 0 этого произведения.

  1. Далее попытаемся найти вектор-функцию

Сначала определим вектордля чего рассмотрим следующее. Приращение функционала относительно оптимальной траектории

,

что ясно из доказательства ПМ. Видно, что . Приращениеидет по линии П, нам важно знать только направление. Для проварьированной траектории примемравной 1 > 0. Т.е. возьмем. Потребуем, чтобы скалярное произведение

,

что возможно при .

  1. Для нахождения вспомогательных функций продифференцируем по времени уравнение (***):

.

  1. Запишем последнее уравнение не в векторной, а в координатной форме:

.

Т.к. , то, т.е. вторую сумму можно записать как

.

Воспользовавшись (**), получим:

.

Из этого можно записать уравнения для :

. (6)

Следует отметить, что уравнения связи в (n+1)-мерном пространстве (5) и уравнения для вспомогательных переменных (6) можно объединить одной формой записи. Для этого вводится т.н. функция Гамильтонапеременных,,:

.

Тогда предыдущие системы уравнений можно записать

,

,

и – непрерывны и всюду, кроме точек разрыва, имеют непрерывную производную.

При фиксированных значениях ифункциястановится только функцией управления. Обозначим через

.

Основная теорема ПМ звучит так:

Пусть , где– такое допустимое воздействие, что соответствующая ему фазовая траекторияисходящая в моментиз, проходящая в моментчерез некоторую точку прямой П.

Для оптимальности управления и траекториинеобходимо существование такой ненулевой непрерывной вектор-функции, соответствующей функциямии удовлетворяющей уравнению

или (6),

что:

  1. при любом функциядостигает помаксимума, т.е..

  2. в конечный момент времени имеет место соотношение

, а .

Если процесс оптимален, то эти условия выполняются на всей траектории.

Рассмотрим пример на применение ПМ.

Для объекта с граничными условиями,требуется найти, минимизирующее функционал

.