ПОИСК
Это наилучшее средство для поиска информации на сайте
Метод проекции градиента
из "Приближенное решение задач оптимального управления "
Все функционалы F будем полагать дифференцируемыми в смысле Фреше. Прежде всего заметим, что есть по крайней мере два способа формулировать задачу (6) — (7) в виде (1). [c.141]Задача (11)— (13) в принципе решается, и возможный алгоритм ее решения не так уж сложен, однако сам метод в целом уже не имеет той степени обоснованности, которой обладает метод проекции градиента в точной постановке ведь мы не учитываем связанных с нелинейностью задачи величин, имеющих формально порядок 0(Ц м а). Следующие простые теоремы содержат грубое обоснование метода, основанного на линеаризации. [c.143]
Следующая теорема утверждает, что если при решении задачи (11)—(13) будет получена вариация Szi (i)=0, то данная траектория (и ( ), ( ) удовлетворяет принципу максимума. [c.143]
Теорема 2. Пусть траектория и ( ), х ( ) допустима (т. е. F. [и (-)]=0, i=l,.. ., т u(t) U и не удовлетворяет принципу максимума. Тогда решение задачи (11)—(13) Su (i) 0 и является улучшающей вариацией управления. [c.143]
Эта задача легко решается с любой необходимой точностью. Подробно да этом мы не останавливаемся, так как все эти элементы алгоритма входят в применявшийся в расчетах метод решения задачи (11) — (13) и описаны в 49. Хотя сходимость алгоритма доказана, попытка использования его в практических расчетах оказалась неудачной из-за крайне медленной сходимости. Этот вычислительный эксперимент подробно освещен в 49. Именно поэтому реализация метода проекции градиента потребовала создания специального алгоритма, работающего намного быстрее. Правда, он (см. 49) дает не точное, а лишь приближенное решение задачи (11) — (13), но точное нам и не нужно, так как им определяется лишь вариация управления. Этот алгоритм, по существу, близок к используемому в методе последовательной линеаризации алгоритму решения задачи линейного программирования. Кстати, при S = o задача (11) — (13) переходит в задачу линейного программирования, решение которой определяет вариацию управления в методе последовательной линеаризации ( 19, 21, 48). [c.146]
Таким образом, задача (11) — (13) оказалась не столь уж простой, и хотя общая идея метода проекции градиента сформулирована очень давно, ее реализация применительно к достаточно общей задаче оптимального управления осуществлена, видимо, впервые в работе автора [96]. Решение конкретных задач описано в 34, 37. [c.146]
Однако для частных классов задач метод проекции градиента был предложен намного раньше. Эти частные классы выделяются тем, что задача проектирования, аналогичная задаче (11) — (13), оказывается более простой и решается привычными вычислительными методами. Можно выделить два класса таких задач. [c.146]
Множители ( находятся после подстановки (19) в условия (18) решением системы т линейных алгебраических уравнений. [c.147]
Задача решается методом Лагранжа и приводит к конструкции типа (19) после решения той же самой системы т линейных алгебраических уравнений. Задачи (17), (18) и (24)—(26) эквивалентны и отличаются лишь способом введения шага S. Другими словами, между параметрами S, входящими в эти задачи, можно установить такое соответствие, при котором обе дают одну и ту же функцию Su (t). Проверку этого факта предоставим читателю. [c.148]
Задача (27), (28) эквивалентна задачам (17), (18) и (24)—(26), в указанном выше смысле. [c.148]
После того как получена траектория, удовлетворяющая условию (31), начинается процесс минимизации 0, в ходе которого постепенно накапливаются невязки в уравнении ж=/. Как только условие (31) оказывается нарушенным, снова решается задача (34), (35), но теперь уже, как правило, достаточно однократного вычисления поправок (8ц( ), bx(t) , и задача (36) не решается, а сразу берется исправленная траектория (и ( )- -Ъи (t), x ( ) + 4-йж (t) . В наших расчетах процесс минимизации F0 объединен с процессом погашения невязок. Это можно сделать и в данном алгоритме, если при решении задачи (29 ), (30 ) не игнорировать правой части уравнения в вариациях (30 ). Существенного значения для эффективности процесса решения вариационной задачи эта деталь, видимо, не имеет. [c.152]
Метод проекции градиента и скользящие режимы. Следует особо отметить те задачи, в которых конструкция (45) будет иметь значительное преимущество перед методом проекции градиента в форме (46), (43). Это — задачи, где оптимальная траектория содержит участок так называемого скользящего режима (см. 23). В этом случае могут существовать неоптимальные траектории, на которых конструкция (46) при не слишком больших s дает функцию u(t, s)=u (t) такая траектория оказывается тупиковой для методов (46), (43). В то же время конструкция (45) приводит к ненулевой вариации управления и (t, з)фи (t). Пример, рассмотренный в 23, показывает, что эта возможность действительно реализуется при численном решении подобных задач, причем множество тупиковых для локального варианта проекции градиента (46) траекторий достаточно мощно и содержит траектории, далекие от оптимальной. Тем не менее, в дальнейшем мы будем иметь дело именно с локальным вариантом. Это связано с тем, что среди известных автору прикладных задач, решавшихся приближенными методами, нет задач, содержащих скользящие режимы. Более того, в монографиях [39], 1102], посвященных преимущественно обобщению теории вариационных задач, охватывающему и скользящие режимы (что, разумеется, приводит к серьезному усложнению аналитического аппарата теории), подобных примеров тоже нет Речь, разумеется, идет о примерах задач, естественно возникших в приложениях, а не специально сконструированных с целью иллюстрации тех или иных возможных осложнений. С этой точки зрения те предостережения, которые делает инженерам и физикам автор [102] в связи с наивным использованием результатов классического вариационного исчисления, представляются преувеличенными. Разумеется, практика решения вариационных задач может расшириться, и задачи со скользящими. режимами станут обычным, инженерным явлением. В этом случае изменится и отношение к соответствующему разделу в теории, и в вычислительные методы будут внесены необходимые коррективы. [c.155]
В этом случае условие F [и ( ), Г]=0 используется в качестве признака окончания интегрирования системы ж=/, х (0)=Х0, и всегда выполнено на очередной варьируемой траектории и ( ), х ( ) . Оба функционала предполагаем дифференцируемыми, т. е. могут быть вычислены функции w( (f) и числа af, i=0, 1 (см. [c.156]
По существу, wa (t) есть проекция градиента на линейное подпространство, касательное к многообразию, выделенному условием Рг[и ( ), Т]=0. [c.156]
Не следует, однако, упускать из виду, что основное достоинство задач без дополнительных условий состоит в возможности использовать для выбора шага s задачу (43), не заботясь о том, какой, большой или малой, окажется при этом величина s. To же самое относится и к задаче с одним дополнительным условием и свободным временем. В этом случае мы все время имеем дело с траекториями, лежащими на многообразии Рг [и ( ), Т 1=0, и можем не заботиться о величине шага s и о влиянии неучтенных при выборе вариации управления величин 0(Ц8м 2). Это же относится еще к одному классу задач, в которых система уравнений x=f (x, и) линейна по а и и, а дополнительные условия поставлены также в терминах линейных как по х, так и по и функционалов (часто, например, такие условия имеют вид х (Т)=Х1). [c.157]
Метод штрафных функций позволяет любую самую общую задачу оптимального управления свести (приближенно, но с любой необходимой степенью точности) и к простейшей неклассической, и к задаче классического типа, и, наконец, к задаче, в которой нет ни условий типа Ft [и ( )]=(), ни геометрических ограничений u(t) U. Однако это достигается ценой введения в задачу больших параметров, что в свою очередь приводит к функционалу с соответственно малой областью точности линейного приближения. Минимизация подобных функционалов оказывается крайне сложной, а полученные результаты — не очень надежными. Этим мы здесь и ограничимся, так как методу штрафных функций посвящен отдельный параграф ( 50). [c.160]
Итерационный метод работы с неравенствами, как с равенствами, был предложен в [51]. Суть дела поясним на самом простом примере. Пусть в задаче есть одно условие-неравенство 9 1и (t)] 0. Тогда процесс построения вариации 8ц (t) начинается с того, что все неравенства игнорируются и проекция градиента вычисляется классическими методами. Найденная вариация 8ц (t) может привести к нарушению условия 9 0- Пусть на некотором интервале Ult tz] окажется 9 I ( )+ ц (t)] 0. Тогда на этом интервале условие 9 0 заменяется условием-равенством 9 [и ( )]=0, и находится новая вариация 8ц (t) в задаче, поставленной только в терминах равенств, снова проверяется условие 9 0 и т. д. Однако этот эрзац операции проектирования теоретически несостоятелен в простых ситуациях он может привести к 8u (i)=0, хотя варьируется траектория очевидным образом неоптимальная, и правильное проектирование градиента привело бы, конечно, к 8ц ( ) 0. [c.162]
Вернуться к основной статье