Полная версия

Главная arrow Математика, химия, физика arrow ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ И МЕТОДЫ ОПТИМИЗАЦИИ

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>

Принцип максимума

Здесь мы остановимся на одном из фундаментальных результатов теории оптимального управления, полученных отечественными учеными во главе с Л. С. Понтрягиным в середине прошлого века, а именно на принципе максимума [11]. При этом будем стараться придерживаться терминологии, принятой создателями принципа максимума.

Прежде чем переходить к изложению существа принципа максимума, приведем полную постановку задачи теории оптимального управления для нескольких функций одного независимого переменного. Напомним, что сама формулировка такой задачи по сути представляет собой расширенную (нсклассическую[1]) постановку задачи Лагранжа (или более общей задачи Лагранжа—Больца), как на это указывалось в п. 7.2.

гдеx(t) и и(!) — вектор-функции размерностью пит соответственно; /п и — заданные концевые точки.

Отсутствие производных в функционале (7.67) обусловлено тем, что в согласии с формализмом постановок рассматриваемого класса задач производные вектор-функций x(t) входят в постановку соответствующей задачи Коши:

Вектор-функция управления u(t) принадлежит некоторой замкнутой ограниченной области (/„. При этом в классическом оптимальном управлении, построенном на подходах вариационного исчисления, такие ограничения, как правило, имеют вид (7.5) или (7.6), или более общий:

где v — вектор вспомогательных управлении размерности т. Теперь мы можем построить расширенный функционал:

где X и ц — соответствующие ограничениям (7.68) и (7.69) множители Лагранжа размерности пит, соответственно.

Функционал (7.67) удобно записать, введя гамильтониан (см. (2.18)), отвечающий нашей задаче:2

  • 1 Далее будет рассмотрен и общий случай подвижных концов.
  • 2 Знак «минус» перед функцией/° обусловлен тем, что далее мы будем говорить о поиске минимума функционала./.
  • 1

т. е.

Теперь, когда мы сформулировали задачу оптимизации в традиционной для теории оптимального управления форме, перейдем к собственно принципу максимума.

В дальнейшем в согласии с традициями теории оптимального управления компоненты У (/' = 1, 2, п) вектора x(t) состояния будем называть фазовыми координатами. Также как и ранее, считаем, что все функции/' (/ = 1, 2,..., п) определены для всех функций У и функций управления U из допустимой области U0. Так же предполагаем дифференцируемость всех функций/7 по У, а функции управления U полагаем кусочно-непрерывными.

Формулировка принципа максимума предполагает введение вспомогательной переменнойх°, позволяющей исключить из рассмотрения функционал (7.67), что реализуется путем введения уравнения связи:

Дополним уравнением (7.77) систему уравнений (7.68) и введем в рассмотрение вектор1

который в отличие от исходного будем обозначать «жирным» шрифтом и с помошыо которого систему уравнений (7.68), (7.71) можем записать в виде

Заметим при этом, что правая часть вновь полученной системы уравнений (7.73) не зависит от переменнойУ. Отметим также, что [2]

если управляющая вектор-функция u(t) такова, что переводит вектор состояния (7.72) нашей системы из исходного x(t0) = х0 в конечное состояние х(/,) = хр то для компоненты х° находим

При t = tx для х° получаем исходный функционал:

Таким образом, решение системы уравнений (7.73) с начальным условием х() = дг(/0) = (0, х'(/0), л^(/0), ..., х"(/0)) при / = tx проходит через точку х, = х(/,) = (У, х'(/1),х2(^|),..., х"(/,)). Теперь мы можем определить некоторое множество Р в пространстве фазовых координат А'— «прямую», проходящую через точку х(г,) = (0, х1 (/,), х21), ...,х"(/|)), отвечающую нулевому значению функционала: У =х°(г1) = = 0. Очевидно, что различным функциям u(t) будут отвечать различные значения х°(г,) = У на нашей прямой Р.

Итак, вместо традиционной для вариационного исчисления и теории оптимального управления постановки задачи о минимуме функционала (7.67) с соответствующими ограничениями (7.68), (7.69) и поиском экстремума среди функций управления из допустимой области в рамках принципа максимума рассматривается следующая задача.

Пусть в пространстве фазовых координат X задана начальная точках() = (0,х‘(/0),х2^), ...,х"(/0)) и «прямая» Р, проходящая через точку х(г,) = (0, х1 (/j), х2^), ...,х"(У|)). Среди всех допустимых управлений u(t), таких, что решение задачи Коших(Г) для системы уравнений (7.73) с начальным условием х(г0) =х0 пересекает «прямую» Р, найти такое, для которого точка пересечения с У имеет наименьшее значение координаты х°.

Прежде чем формулировать основную теорему, составляющую суть принципа максимума, нам потребуется ввести некоторые дополнительные понятия.

В силу линейности и однородности система (7.75) допускает единственное решение р = (ц/0, у,, р2,..., in). Заметим, что функции |/(. непрерывны и имеют непрерывные производные всюду на [/0, /,] за исключением конечного числа точек разрыва управлений.

Теперь построим новую функцию ГамильтонаЗСперемен- ных

В первую очередь, наряду с системой уравнений (7.73), которую запишем в скалярной форме:

мы рассмотрим еще одну систему уравнений относительно вспомогательных переменных |/0, |/р у,,..., in, которые называют сопряженными:

которая отличается от исходной (7.70) наличием множителей (/у, заменивших множители Лагранжа X., и отсутствием подключенных ограничений (7.69) для управляющих функций.

В таком случае система уравнений (7.74), (7.75) может быть записана в следующей гамильтоновой форме, которую мы ввели в п. 2.3:

Итак, для произвольного допустимого вектора управления u(t) и начального условия х(/0) =х0 находим соответствующее решение системы уравнений (7.74), т. е. траекторию x(t). Затем определяем соответствующее найденным функциям u(t) и Х(г) решение системы (7.75):

Как же определяется оптимальная тройка векторов: u(t), х{1) и |/(Г)? То есть в чем же новизна идеи принципа максимума в сравнении с традиционным подходом вариационного исчисления с определением оптимальных векторов u(t), x(t) и X(t) из полной системы необходимых условий?

В принципе максимума предлагается разыскивать экстремальное значение введенной ранее функции Гамильтона ЗС. А именно при фиксированных функциях р и х величина ЗС становится функцией вектора управления и е t/0. Пусть

Если точная верхняя грань значений непрерывной функции ЗС достигается при некотором и из допустимой области U0, то Л/(|/, х) есть максимум значений ЗС для данных фиксированных i их. Таким образом, приходим к теореме о принципе максимума, которую приведем без доказательства.

Теорема 7.1. Пусть u{t), t е [/0, /,], — допустимое управление, такое, что отвечающая ему траектория x(t) системы уравнений (7.74) с начальным условием х(/0) = х0 в момент проходит через некоторую точку «прямой» Р. Для оптимальности пары u(t), х(1) необходимо существование такой ненулевой вектор-функции vp(/) = (|/0 00, у, 0), ..., v|/„ 0)), соответствующей функциям u(t) и x(t), что:

1) при всех /?€[?(), /, ] функция ЗС (ф(Д ДО, Ш)) как функция переменного и <= Un достигает при некотором u(t) максимума:

2) в конечный момент времени /, выполнены соотношения

При этом если величины ф(/), x(t) и н(/) удовлетворяют уравнениям (7.76) и условию 1, то функции фн(/) и Л/(ф(0, x(t)) переменного t постоянны.

Рассмотренный случай отвечает простейшей задаче, в которой значения концевых точек /0 и /, заданы. Поэтому естественно рассмотреть в рамках принципа максимума и задачу с подвижными концами. Как мы помним (см. п. 7.2, где мы рассматривали условия трансверсальности), в общем случае концевые точки перемешаются по некоторым кривым (трансверсалям), которые для нескольких функций одного независимого переменного есть некоторые гиперповерхности. Будем предполагать подвижность каждого из концов t0 и при этом пусть левый конец х(/0) «перемещается» по гиперповерхности S0, тогда как правый л'(/() — по гиперповерхности Sv

ПустьтеперьДх,,х2, ...,хн) — уравнение некоторой гиперповерхности S в «-мерном пространстве. Напомним, что касательной гиперплоскостью Т к гиперповерхности S в некоторой точке х0 называют такую гиперплоскость, которая имеет своей нормалью вектор-градиент grad Дх0) к 5 в этой точке. Говоря иначе, вектор- градиент ортогонален ко всем векторам, лежащим в касательной гиперплоскости, проходящей через точку лг0. В связи с последним отметим, что если У=ф'(9) (/= 1,2,..., п) — параметрическая запись некоторой линии л: =у(9) в пространстве Л', то касательный вектор к этой линии в некоторой точке ф(9п) имеет вид:

Таким образом, касательный вектор (7.80) линии, лежащей на некотором гладком многообразии М, является касательным вектором и к данному многообразию в точке ф(90).

В рамках принципа максимума показывается, что вектор ф(/) удовлетворяет условию трансверсшьности на левом конце, т. е. в точке лг(/0), если он ортогонален гиперплоскости Т0, отвечающей гиперповерхности 50. Аналогично для правого конца, т. е. для точки *(/,), на гиперповерхности 5, должно выполняться условие ортогональности вектора ф(г) гиперплоскости Т] в этой точке. Таким образом, мы можем сформулировать такую теорему.

Теорема 7.2. Пусть и(/), / е [/0, — допустимое управление

переводящее фазовый вектор состояния системы x(t) изх(/'0)е5() в состояние Для того чтобы пара u(t) и x(t) давала решение

задачи оптимизации с подвижными концами, необходимо существование ненулевой непрерывной вектор-функции ф(/), удовлетворяющей условиям теоремы 7.1 и условиям трансверсальности на каждом из концов траектории.

Таким образом, в принципе максимума условия трансверсальности — это условия, которые в самом общем случае позволяют найти компоненты вектора x(t) на каждом из концов траектории, т. е. на гиперповерхностях 50 и 5,. Естественно, что если какая- либо из гиперповерхностей 50 или S', или обе вырождаются в точку, то и траектория x(t) также должна пройти через эту точку, т. е. условие трансверсальности заменяется условием прохождения через эту точку (или точки).

В чем же отличие принципа максимума от традиционного подхода оптимального управления, построенного на вариационном исчислении? Начнем с того общего, что их объединяет. Во-первых, это необходимость интегрирования уравнений для вектора состояния рассматриваемой системы х(t) и уравнений для отвечающего ей вектора множителей Лагранжа X(t), роль которого в принципе максимума играет вектор[3] ф(/). Но далее подходы существенно различаются. Как мы помним, в вариационном исчислении должно рассматриваться условие Вейерштрасса сильного минимума или условие Лежандра слабого минимума. При применении вариационного исчисления в теории оптимального управления мы должны опираться на условие Вейерштрасса, поскольку имеем дело с разрывными управляющими функциями и(/), что приводит к разрывам соответствующих производных векторов состояния dx/dl.

Теперь нам необходимо обратиться к условию Вейерштрасса сильного минимума функционала

Принцип максимума можно трактовать как расширение условия Вейерштрасса на класс ограниченных управлений u(t), принадлежащих замкнутой области U0. Однако необходимое условие Вейерштрасса в общем случае замкнутой области U0 изменения управлений м(/) неверно. Но как мы видели ранее, именно замкнутые области изменения функций управления практически наиболее интересны.

Обратимся теперь к выражению для гамильтониана (7.70):

Это классическая форма гамильтониана, которая содержит связь со всеми ограничениями — как с дифференциальными (7.68), так и с ограничениями на управления (7.69).

Неравенство Вейерштрасса для функционала, зависящего от п функций одного независимого переменного, мы получили в п. 1.6. Записав исходный функционал (7.67) и переменные задачи в форме, принятой в данном разделе, т. е. в виде

введем в рассмотрение лагранжиан

с помощью которого функция Вейерштрасса может быть записана в виде где dX'/dt — произвольные значения производных, отвечающие допустимым управлениям U', dX/dt—cbJ/dt (/' = 1, 2, п) есть величины вариаций производных, отвечающие такому допустимому управлению[4] U'.

Как мы помним, функция Всйсрштрасса на оптимальном решении (в нашем случае на паре х(/), и(/)), отвечающем минимуму функционала, неотрицательна:

при любых dX/dt и t/и для определяемых этой парой х(1), u(t) вектор-функций X и ц.

Запишем функцию Вейерштрасса (7.81), используя выражение для лагранжиана (7.80) в таком, удобном для дальнейших рассмотрений, виде:

Тогда неравенство Вейерштрасса (7.82) примет вид:

Теперь самое время обратиться к введенной нами функции

которая как функция переменного и е U{) в согласии с теоремой 7.1 достигает максимума на оптимальном управлении u(t), который согласно (7.78) равен Л/(ф(Г), x(t)). Но отсюда видно, что неравенство Вейерштрасса есть частный случай принципа максимума, поскольку последний, будучи записан в виде

с точностью до обозначений выражает неравенство Вейерштрасса для управляющих функций, принадлежащих к замкнутой ограниченной области U0. При этом соответствующий принципу максимума гамильтониан ЗС (7.84) не содержит ограничений (7.69) на управляющие функции, подключаемые в классическом гамильтониане Н (7.70) с помощью вектора множителей Лагранжа ц.

Ранее в этом разделе мы рассмотрели примеры решения задач оптимизации с использованием вариационного исчисления. Это были задачи теории газовой смазки, связанные с линейным уравнением Рейнольдса. Приведем еще один пример решения задачи изданной области, пользуясь принципом максимума.

Пример 7.5 (задача Рэлея теории смазки для радиального подшипника [12]). Постановка задачи здесь совершенно аналогична рассмотренной в примере 7.2, с той лишь разницей, что давление на боковых границах 0О и 0, задано, а положение самих границ разыскивается в процессе решения задачи (см. рис. 7.2).

Итак, разыскивается экстремум (максимум) функционала —у— компонента главного вектора сил давления F.

х-компоненту исходя из условий равновесия приравняем к нулю:

Как и ранее, толщина смазочного слоя должна удовлетворять неравенству

а поле давления в смазочном слое описывается линейным уравнением Рейнольдса (7.8), которое, как и ранее, запишем в виде

Краевые условия к уравнениям (7.88) отвечают равенству избыточного давления /;(0) нулю на границах области:

Сформулируем задачу оптимизации. Среди кусочно-непрерывных функций Л(9), непрерывных функций р(9) и постоянных Q, удовлетворяющих ограничениям (7.86)—(7.89), найти минимум[5] функционала (7.85) в условиях подвижности границ 0() и 0Г

Теперь, следуя принятому при рассмотрении принципа максимума формализму, перейдем от функционала (7.85) и изопериме- трического условия (7.86) к их дифференциальным аналогам, введя вспомогательные переменные х° и х[5]:

Также введем следующие обозначения:

х[7] = р; x‘=Q х4 = 0.

Таким образом, система ограничений рассматриваемой задачи принимает вид:

Отметим, что последнее из уравнений системы (7.90), а именно уравнение для переменнойх4, необходимо, поскольку будет служить далее для определения граничных точек 0О и 0Р при этом переменной х4 мы будем пользоваться наряду с переменной 0.

Выпишем краевые условия к системе уравнений (7.90):

Итак, нами построен вектор состояния системы (см. (7.72)):

для которого в согласии с принципом максимума должен существовать ненулевой вспомогательный (сопряженный) вектор:

где функции ф,(0) являются решениями сопряженной системы уравнений (7.76):

Гамильтониан 9С в нашей задаче в согласии с определенной ранее системой (7.90) имеет вид:

откуда для сопряженной системы (7.92) получаем уравнения:

Заметим, что уравнение для v|/4(0) выписывать нет необходимости, поскольку функцию г|г4(0) можно определить непосредственно из гамильтониана (7.93) в виде

Согласно принципу максимума гамильтониан (7.93) на оптимальном управлении-зазоре /?(0) должен принимать максимальное значение, откуда легко найти, что

Соответствующий градиент давления в согласии с (7.88)

и положителен при всех Q. Поскольку наряду с (7.96) решением может быть только вариант /?(0) = 1, очевидно, что только два таких случая и реализуются. Замечая, что при Л(0) = 1 градиент вычисляется по формуле

получаем, что для выполнения краевых условий величина х3 = Q должна быть отрицательной, причем |(9| > 1.

Итак, оптимальная функция /?(0) кусочно-постоянна, и нам нужно ответить на вопрос, где располагаются участки с И > 1 и И = = 1, а также найти координаты 0О и 0Г

Начнем с ответа на вопрос, где располагаются названные участки. Для этого необходимо обратиться к гамильтониану 9С, выражаемому формулой (7.93). Очевидно, что максимизация ЗС наряду с /?(0) определяется знаком функции |/2(0), что требует интегрирования системы сопряженных уравнений (7.94). Здесь

Что касается функции |/4(0), то отсюда в согласии с (7.95) получаем

По предыдущему получим

Таким образом, необходимо установить области постоянства знака функции у2. При этом согласно (7.99) получим

где С, и С2 — постоянные.

Ответ на вопрос о числе смен знака у функции |/2 требует рассмотрения условий трансверсальности.

Как мы помним, условия трансверсальности в принципе максимума означают ортогональность вектор-функции j/(9) плоскостям Т0 и Гр касательным к соответствующим гиперповерхностям S0 и Sy Вид последних в рассматриваемой задаче определяется ее исходной постановкой. Начнем с того, что согласно краевым условиям (7.89) давление, т. е. переменная х2, обращается в нуль на границах. Так же на левой границе по (7.91) ведут себя величины х^ их1.

Тогда левое многообразие S0 (х* =ф'(0), / = 1, 2,..., 4), где ср°(0) = = 0, ср1 (0) = 0, ф2(0) = О, ф3(0) = О, Ф4(0) = 0 при 0 = 0О, может быть записано в виде х° = 0, х1 = 0, х2 = 0, х3 = 0, х4 = 0, т. е. 50(0, О, О, О,

  • 0) , и согласно (7.80) векторы касательного многообразия (0,0,0,0,
  • 1) . Таким образом, условие ортогональности вектора vp(0) векторам касательного многообразия при 0„ дает

откуда находим |/(0О) = 0, / = 0,1,..., 4. Аналогичные рассуждения приводят для многообразия 5, к таким же условиям: ф,(0,) = 0, / = 0, 1,..., 4 при 0 = 9Г

Обращаясь теперь к выражению (7.101) для функции ф2(0), видим, что полученные нулевые краевые условия требуют для нее смены знака на промежутке [0О, 0,1, что возможно только при 0, — 0О = 2л. Отсюда следует, что рассматриваемый радиальный подшипник замкнутый с бесконечно тонкой питающей щелью, посредством которой происходит газообмен с внешней средой.

Дальнейшие рассуждения в определенной степени близки к рассмотренным в примерах 7.1 и 7.2, поэтому приведем их в кратком виде. Поскольку имеются только две области — области постоянства А(0) соответственно с А(0) = —3/2Q > 1 и А(0) = 1, возникает вопрос о порядке их расположения. Давление в силу характера функционала (7.85) должно быть положительным, поэтому в согласии с (7.97) необходимо, чтобы область с /г(0)> 1 располагалась первой по направлению вращения, что способствует росту давления. Итак, при [0О, 0f) избыточное давление нарастает, тогда как в области [0„ 0,] оно падает до давления внешней среды. В таком случае точка 0с есть точка разрыва профиля, где претерпевает разрыв и градиент давления.

Итак, вариационная задача снова оказывается сведенной к задаче параметрической оптимизации, где в качестве параметров выступают значение расхода Q, положение границ области 0, и 0О (точнее одной из границ, поскольку они связаны соотношением 0, — 0О = 2л), а также положение точки разрыва профиля 0(.. В данной задаче удается построить явное выражение для функционала, т. е. для подъемной силы. Читателю предлагается сделать это самостоятельно.

Задача имеет два решения. Первое, которое естественно назвать симметричным, имеет такие параметры: 0О = 0, 0(.=л, 0, = 2л, Q= —1,1184 при значении функционала У=0,4736. Второе решение, которое и является оптимальным, имеет такие параметры: 0О=—ЗГ, 0С=21Г, 0, = 329°, Q =—1,208 при значении функционала У = 0,5308. Результаты оптимального решения задачи представлены на рис. 7.7. Поучительно сравнить полученное здесь решение с решением периодической задачи, рассмотренной в примере 7.2.

Замечание 7.1. Подход к решению задачи оптимизации на основе принципа максимума несколько отличается от подхода классического вариационного исчисления. В вариационном исчислении мы в первую очередь рассматриваем уравнения Эйлера—Лагранжа, определяя тем самым множество подозрительных на экстремум функционала функций х(/) и u(t) и отвечающих им множителей Лагранжа. Затем, используя условия Лежандра или Вейерштрасса, определяем тип такого экстремума - слабый он или сильный. При этом мы должны корректно с помощью соответствующих множителей Лагранжа и вспомогательных управлений v(/) (см. п. 7.2) подключать ограничения на управления. Применение принципа максимума также требует от нас рассмотрения уравнений для

Профиль оптимального радиального подшипника (а) и распределение давления в оптимальном радиальном подшипнике (6)

Рис. 7.7. Профиль оптимального радиального подшипника (а) и распределение давления в оптимальном радиальном подшипнике (6)

функцийx(t) и u(t) сопряженных множителей ф(/) (последние играют роль множителей Лагранжа), определяя тем самым множество подозрительных на экстремум функционала функций x(t) и u{t). Но в отличие от классического вариационного исчисления здесь мы разыскиваем не экстремум функционала, а максимум гамильтониана, причем в условиях принадлежности вектора управления u(t) замкнутой области U.

  • [1] В термин «неклассические задачи» здесь мы «вкладываем» учетвсех тех ограничений, которые встречаются в постановках задач оптимального управления, например, принадлежность управления к замкнутой ограниченной области, о чем подробно говорится далее.
  • [2] То есть мы строим расширенный вектор л: = (У, У, У,..., х") нарядус исходным х = (У, У,..., У').
  • [3] Разумеется, мы предполагаем, что для подвижных границ краевые условия для вектора x(t) и Х(1) определяют из классических условийтрансверсальности, тогда как в принципе максимума такие условия длях(1) и i[i(/) находят из соответствующих условий ортогональности вектора4>(0 гиперповерхностям 50 и 5, в концевых точках.
  • [4] Отметим, что жирным шрифтом мы обозначаем любое допустимоеуправление U из замкнутой допустимой области U{).
  • [5] Поиск минимума, естественно, предполагает смену знака у функ
  • [6] Поиск минимума, естественно, предполагает смену знака у функ
  • [7] ционала (7.85).
 
<<   СОДЕРЖАНИЕ ПОСМОТРЕТЬ ОРИГИНАЛ   >>