Принцип максимума Понтрягина

Во многих прикладных задачах на управление накладывается ограничение типа неравенства. Часто оптимальное управление в таких задачах имеет разрыв. Метод множителей Лагранжа не позволяет определить число и местоположения точек разрыва, и поэтому в этих случаях он неэффективен. Такие задачи легче решаются с помощью принципа максимума Понтрягина.

Принцип максимума, сформулированный Л. С. Понтрягиным в 1953 г. как необходимое условие экстремума для задач оптимального управления, был доказан и развит им, его учениками и сотрудниками [3, 12, 51].

Задача с закрепленными концами и фиксированным временем.

При отсутствии фазового ограничения задачу оптимального управления с закрепленными концами и фиксированным временем в общем виде можно сформулировать как следующую задачу Лагранжа:

Отсюда находим

Функции fi (i = 0,1,..., п) непрерывны по совокупности переменных xi,..., хп, ..., ur, t и непрерывно дифференцируемы

но ®i,..., xn, t. Эта задача отличается от задачи оптимального управления классического типа (9.24) тем, что ограничение задается только на управление и в виде включения и € С/, где U — допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций /* (г = 0,1,... ,п) по и.

В данной задаче допустимыми управлениями считаются управления и(?), принадлежащие к классу кусочно непрерывных функций и принимающие значения из допустимого множества U. Фазовая траектория x(t) называется допустимой, если она является кусочно гладкой. При допустимом управлении фазовая траектория задачи (9.33) является кусочно гладкой: координаты х*(?) (г = 1,2,... ,п) непрерывны всюду на интервале [to,tf], их производные могут иметь разрывы 1-го рода в точках разрыва управления. Пара (u(t),x(t)) называется допустимой для задачи (9.33), если u(t) и x(t) являются допустимыми управлением и траекторией и x(t) при и = u(t) удовлетворяет уравнениям объекта и краевым условиям этой задачи.

Применим к задаче (9.33) прием Лагранжа [3]. Составим функцию

где

Здесь функции L и Я также называют функцией Лагранжа и гамильтонианом соответственно. Но они отличаются от одноименных функций классического вариационного исчисления тем, что в них не входит ограничение на управление, имеющее в данном случае вид включения u € U. В конкретных задачах ограничение на управление может быть задано в виде неравенства или равенства. Гамильтониан (9.34), который не включает ограничение на управление, в отличие от гамильтониана, включающего ограничение на управление, называют также функцией Понтрягина.

В соответствии с приемом Лагранжа задача (9.33) сводится к задаче

Функционал J максимизируется, хотя функционал J в исходной задаче требуется минимизировать, так как множитель фо при /о в неособом случае принимается отрицательным (фо — — 1)* В особом случае (фо = 0) функционал J не зависит от J.

Пусть тройка (x*(t)yu*(t),i/>*(t)) есть решение задачи (9.35). Задача (9.35) равносильна следующим двум задачам:

Естественно, задачи (9.35) и (9.36), как и исходная задача, рассматриваются в классе допустимых функций, причем функция ip(t) называется допустимой, если она, как и х(?), принадлежит к классу кусочно гладких функций.

Задача (9.36а) является простейшей задачей вариационного исчисления. Для нее необходимое условия максимума (уравнения Эйлера) (9.27) принимает вид

или

В задаче (9.366), очевидно, интеграл примет максимальное значение при таком управлении, при котором подынтегральное выражение как функция от управления и примет максимальное значение. Следовательно, управление u*(t) будет решением задачи (9.366), если оно доставляет максимум гамильтониану, или если всюду на интервале [to,tj], кроме точек разрыва и*(0, будет выполнено равенство

Необходимое условие (9.37) совместно с соотношением (9.38) образует необходимые условия оптимальности исходной задачи (9.33), называемые принципом максимума или принципом максимума Понт- рягина. Уравнения (9.376) совпадают с уравнениями объекта, и поэтому их можно не рассматривать. Уравнения (9.37а) называют сопряженными уравнениями или сопряженной системой.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >