МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 141 [c.141]
МЕТОД ПРОЕКЦИЙ ГРАДИЕНТА 143 [c.143]
Задача"(11)— (13) в принципе решается, и возможный алгоритм ее решения не так уж сложен, однако сам метод в целом уже не имеет той степени обоснованности, которой обладает метод проекции градиента в точной постановке ведь мы не учитываем связанных с нелинейностью задачи величин, имеющих формально порядок 0(Ц м а). Следующие простые теоремы содержат грубое обоснование метода, основанного на линеаризации. [c.143]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 145 [c.145]
Эта задача легко решается с любой необходимой точностью. Подробно да этом мы не останавливаемся, так как все эти элементы алгоритма входят в применявшийся в расчетах метод решения задачи (11) — (13) и описаны в 49. Хотя сходимость алгоритма доказана, попытка использования его в практических расчетах оказалась неудачной из-за крайне медленной сходимости. Этот вычислительный эксперимент подробно освещен в 49. Именно поэтому реализация метода проекции градиента потребовала создания специального алгоритма, работающего намного быстрее. Правда, он (см. 49) дает не точное, а лишь приближенное решение задачи (11) — (13), но точное нам и не нужно, так как им определяется лишь вариация управления. Этот алгоритм, по существу, близок к используемому в методе последовательной линеаризации алгоритму решения задачи линейного программирования. Кстати, при S = o задача (11) — (13) переходит в задачу линейного программирования, решение которой определяет вариацию управления в методе последовательной линеаризации ( 19, 21, 48). [c.146]
Таким образом, задача (11) — (13) оказалась не столь уж простой, и хотя общая идея метода проекции градиента сформулирована очень давно, ее реализация применительно к достаточно общей задаче оптимального управления осуществлена, видимо, впервые в работе автора [96]. Решение конкретных задач описано в 34, 37. [c.146]
Однако для частных классов задач метод проекции градиента был предложен намного раньше. Эти частные классы выделяются тем, что задача проектирования, аналогичная задаче (11) — (13), оказывается более простой и решается привычными вычислительными методами. Можно выделить два класса таких задач. [c.146]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 147 [c.147]
Варианты. Метод проекции градиента настолько естествен, что предлагался многими авторами независимо друг от друга. Иногда эти предложения отличались только формой описания, иногда — деталями, не имеющими, видимо, принципиального значения. Полезно указать, хотя бы в общих чертах, эти внешне различные варианты метода, [c.147]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 151 [c.151]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 153 [c.153]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 155 [c.155]
Метод проекции градиента и скользящие режимы. Следует особо отметить те задачи, в которых конструкция (45) будет иметь значительное преимущество перед методом проекции градиента в форме (46), (43). Это — задачи, где оптимальная траектория содержит участок так называемого скользящего режима (см. 23). В этом случае могут существовать неоптимальные траектории, на которых конструкция (46) при не слишком больших s дает функцию u(t, s)=u (t) такая траектория оказывается тупиковой для методов (46), (43). В то же время конструкция (45) приводит к ненулевой вариации управления и (t, з)фи (t). Пример, рассмотренный в 23, показывает, что эта возможность действительно реализуется при численном решении подобных задач, причем множество тупиковых для локального варианта проекции градиента (46) траекторий достаточно мощно и содержит траектории, далекие от оптимальной. Тем не менее, в дальнейшем мы будем иметь дело именно с локальным вариантом. Это связано с тем, что среди известных автору прикладных задач, решавшихся приближенными методами, нет задач, содержащих скользящие режимы. Более того, в монографиях [39], 1102], посвященных преимущественно обобщению теории вариационных задач, охватывающему и скользящие режимы (что, разумеется, приводит к серьезному усложнению аналитического аппарата теории), подобных примеров тоже нет Речь, разумеется, идет о примерах задач, естественно возникших в приложениях, а не специально сконструированных с целью иллюстрации тех или иных возможных осложнений. С этой точки зрения те предостережения, которые делает инженерам и физикам автор [102] в связи с наивным использованием результатов классического вариационного исчисления, представляются преувеличенными. Разумеется, практика решения вариационных задач может расшириться, и задачи со скользящими. режимами станут обычным, инженерным явлением. В этом случае изменится и отношение к соответствующему разделу в теории, и в вычислительные методы будут внесены необходимые коррективы. [c.155]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 157 [c.157]
Метод проекции градиента в задачах с конечными связями. Рассмотрим задачу, в которой, кроме перечисленных в (7) условий, добавлена еще конечная связь между х (t) и u (t) вида [c.157]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 159 [c.159]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 161 [c.161]
МЕТОД ПРОЕКЦИИ ГРАДИЕНТА [c.163]
Решение этой задачи может быть осуществлено простейшим вариантом метода проекции градиента (см. 18). Разумеется, в общем случае речь идет о приближенном решении. В силу предположения о строгой выпуклости D min (z, g) достигается в един- [c.189]
Сравнение с решением задачи методом проекции градиента было проведено для другого варианта, отличающегося следующим [c.245]
Эти данные были взяты из работы [99], где задача решалась классическим вариантом метода проекции градиента, применимость которого обеспечивалась ликвидацией условия и (t) U при помощи замены и на неограниченное и [c.246]
Величина Т была фиксирована, однако затем решалась серия задач с разными Т, что позволило найти и оптимальное Т. В [70] использовался метод проекции градиента на данной траектории (и(-), ( ) вычислялась производная функционала F0 [и ( )] [c.256]
Мы не будем подробно объяснять физический смысл задачи. Ограничимся лишь указанием, что уравнения (1) описывают вращение твердого тела (спутника), снабженного тремя реактивными двигателями, F0 есть расход топлива, условия (3) — суть условия отсутствия вращения (стабилизация). Эта задача была решена аналитически в [33], точное решение ее известно, и она представляет собой удобный методический пример. В дальнейшем была предпринята попытка численного решения задачи методом локальных вариаций[41 ]. Мы говорим лишь о попытке потому, что, как это станет ясным из дальнейшего, полученные в [41 ] численные результаты оказались очень грубыми. Наконец, в нашей работе [96] была показана возможность эффективного и весьма точного решения задачи методом проекции градиента. [c.276]
Решение задачи методом проекции градиента было проведено в целях сравнения двух методов и иллюстрации возможностей метода проекции градиента. Результаты опубликованы в [96] здесь они воспроизводятся. Заметим, что задачи (6) и (8) решались и методом последовательной линеаризации ( 19), но результаты мы приводить не будем, так как они практически те же самые. [c.278]
Решение задачи методом проекции градиента. Задачи 1 и 2 были решены методом проекции градиента, подробно описанным в 18. Схема вычислений в этом случае в основном совпадает со схемой вычислений методом последовательной линеаризации. Основное отличие в том, что вариация управления находится решением задачи квадратичного программирования. Задачи решались при тех же управляющих функциях и при тех же значениях входящих в них параметров, что и [c.323]
Перейдем к результатам. Первый расчет проводился при /7=10 и ограничении на вариацию управления u(t) < 0,016, т. е. в тех же условиях и при той же начальной траектории, что и в соответствующем расчете 37. Вариация управления проводилась методом проекции градиента (см. 18). Заметим, что для перехода от исходного управления к оптимальному нужно изменить и (t) на величину порядка 0,3—0,4. При шаге 8мя 0,016 это в принципе можно сделать за 25 шагов, что и наблюдается в наших расчетах в 37. Результаты расчетов, использующих аппроксимацию (2), приведены в табл. 1, где показаны следующие величины v — номер итерации, значения Flp) и F0 = шах Ф [х (t)]. Величина [c.340]
Не видно и способов, которыми можно было бы добиваться выполнения (15). Попытки использовать замену (14) действительно привели к бессмысленной эволюции v(t) в процессе поиска минимума. Впервые регуляризация численного решения задачи оптимального управления была осуществлена в работе 181], причем использовался именно функционал F0 [и ( ), а] (6). Решалась, кстати, задача, совпадающая с (1), однако в более простой ситуации решение искалось только на интервале ( , 2) (оптимальные значения t и tz можно искать подбором, причем каждый акт подбора связан с решением вариационной задачи на (t1 t2).) Поэтому ограничение О и U отсутствовало, и применялся метод проекции градиента (классический вариант, 18). В этом случае вариация 8u (t) имеет вид [c.354]
Разумеется, и здесь можно применить метод проекции градиента, но мы считаем (и это соответствует положению дел в прикладных задачах такого сорта), что проектирование на множество X, определяемое системой нелинейных уравнений / (z)=0, i=l, 2,.. . . . ., т, является слишком сложной операцией. Алгоритм поиска условного минимума состоит в том, что для каждой точки х нужно уметь строить улучшающую вариацию аргумента ох. При этом приходится иметь в виду не только понижение f (х), но и восстановление условий / (ж)=0, если они оказываются нарушенными. Итак, пусть есть некоторая точка xk, причем условия / (xk)=0 могут и не выполняться. Считая искомую вариацию Ьх малой и ограниченной условием Ьх S, где S — шаг процесса, поставим следующую естественную задачу для определения Ьх [c.400]
Реализация метода проекции градиента в 18 привела к необходимости решения следующей вспомогательной задачи найти числа sn, п=1, 2,. . ., N из условий [c.453]
Предостережение. Опыт решения задач оптимального управления методом проекции градиента еще не очень велик, и некоторые детали не совсем ясны. Автор хотел бы предупредить читателя о"возможных осложнениях. Прежде всего, не очень ясен вопрос о назначении величины rj, задающей требуемую относительную точность решения по значению минимизируемой формы (1). В задаче линейного программирования (при S= o) форма (1) имеет простой содержательный смысл — это значение F0 [Su ( )], и назначение ] =0,1 (0,2 или 0,05, если угодно) в особых разъяснениях не нуждается. В задаче квадратичного программирования форма (1) уже не имеет такого простого значения, часто ее значение [c.458]
Ф е д о р е н к о Р. П. Метод проекции градиента в задачах оптимального управления. — М. ИПМ АН СССР, 1975, № 5. [c.483]
Итерационный метод работы с неравенствами, как с равенствами, был предложен в [51]. Суть дела поясним на самом простом примере. Пусть в задаче есть одно условие-неравенство 9 1и (t)] < 0. Тогда процесс построения вариации 8ц (t) начинается с того, что все неравенства игнорируются и проекция градиента вычисляется классическими методами. Найденная вариация 8ц (t) может привести к нарушению условия 9 0- Пусть на некотором интервале Ult tz] окажется 9 I" ( )+ ц (t)] > 0. Тогда на этом интервале условие 9 0 заменяется условием-равенством 9 [и ( )]=0, и находится новая вариация 8ц (t) в задаче, поставленной только в терминах равенств, снова проверяется условие 9 0 и т. д. Однако этот эрзац операции проектирования теоретически несостоятелен в простых ситуациях он может привести к 8u (i)=0, хотя варьируется траектория очевидным образом неоптимальная, и правильное проектирование градиента привело бы, конечно, к 8ц ( ) 0. [c.162]
Итак, мы имеем большое число возможных типов вариационных задач, некоторое число основных идей численного их решения и достаточно большое число возможных технологических оформлений. И каждый из элементов этих трех уровней может сочетаться если и не с каждым, то с большим числом элементов соседнего уровня. Вот эта-то комбинаторика и создает (в значительной мере) видимое разнообразие методов приближенного решения. Однако в этих комбинациях могут содержаться и очень ценные предложения, когда есть достаточно веские основания утверждать, что для данного специального класса задач следует выбрать именно данный подход и дополнить его именно одним конкретным вариантом технологии, а при других комбинациях получатся заметно менее эффективные или трудно реализуемые методы. Этой трехслойной структуре проблемы приближенного решения задач оптимального управления и соответствуют первые три главы книги. Во второй главе каждый возможный подход описан достаточно подробно, но самый низший уровень — технология вычислений — естественно, не излагается это уже материал третьей главы. Выше мы отмечали, что основных конструкций приближенных методов оказалось не так уж много. Автор надеется, что читатель, разобравшийся в этом материале, без труда убедится, например, в том, что очень большое число предложенных в разное время и в разных странах методов являются несущественными модификациями простейших вариантов метода проекции градиента. [c.14]
Для решения задачи (1) давно предложен и обоснован (при определенных предположениях, обсуждать которые мы здесь не станем) метод проекции градиента. Он представляет собой алгоритм построения минимизирущей последовательности точек и. Пусть имеется некоторое и. Тогда в качестве следующего приближения берется точка [c.140]
В основу дальнейшего будет положен первый способ, хотя некоторые алгоритмы (они будут описаны) основаны на втором. Выше мы убедились, что проектирование на Q практически осуществить не удается. Однако можно построить алгоритм, основанный на проектировании не на Q, а на некоторое многообразие, которое условно можно считать касательным к и в точке и. Речь идет о следующем линеаризуем задачу в окрестности данной точки и и построим метод проекции градиента для линеаризованной задачи. Пусть wt (t) — функциональные производные входящих в задачу функционалов Ff [и ( )], z=0, 1,.. ., т. Будем искать вариацию управления Ьи ( ), решая вариационную задачу найти [c.142]
Gradient-Restoration Algorithm [52], [53] (для задач классического типа). Разработанный в последние годы, метод основан на втором способе интерпретации задачи оптимального управления как общей задачи математического программирования и внешне существенно отличается от приведенных выше форм метода проекции градиента. Однако, кроме формального отличия, здесь есть и некоторое отличие по существу, влияние которого на алго- [c.148]
Паллиативы (метод проекции градиента в общем случае). Выше было показано, что проектирование градиента осуществляется достаточно просто (правда, в линеаризованной постановке, приводящей к проектированию на линейное подпространство) в двух случаях либо при отсутствии дополнительных условий (F(=ff), либо при отсутствии геометрического ограничения на значения и (t) (u( U). Однако большая часть прикладных задач оптимального управления содержит оба сорта условий, а в этом случае проектирование выполняется решением задачи квадратического программирования. К сожалению, идеи и алгоритмы, относящиеся к линейному и нелинейному программированию, мало известны среди специалистов по прикладной механике, которые особенно часто сталкиваются с необходимостью решения задач оптимального управления достаточно общего вида. Именно в этой среде были созданы многочисленные приемы, имеющие целью сформулировать общую задачу как задачу классического типа, либо как простейшую неклассическую задачу. Мы рассмотрим наиболее типичные из этих приемов. Их следует отнести к разряду паллиативов, так как они не снимают трудностей численного решения, а лишь отодвигают их, так сказать, в глубь проблемы. Создание алгоритма приближенного решения задачи оптимального управления можно условно разбить на два этапа [c.160]
Для сравнения в табл. 4 подробно показан начальный этап решения той же задачи методом проекции градиента. Приведены следующие величины v — номер итерации, предсказанное значение х1 (Т), F т F" — значения Ф [х ( )] в двух точках локальных максимумов, среднее значение и( ) и К — число точек аппроксимации в формуле (35). Стоит отметить, что механизм постепенного увеличения К сработал с небольшим опозданием уже на 6-й итерации Ф [х (t) стала двугорбой , и следовало увеличить К с 1 до 2. Таким образом, терминальная задача была довольно легко решена, и уже с 9-й итерации начался процесс минимизации. [c.345]
Смотреть страницы где упоминается термин Метод проекции градиента
: [c.111] [c.149] [c.151] [c.153] [c.258] [c.288] [c.355] [c.457] [c.458]Смотреть главы в:
Приближенное решение задач оптимального управления -> Метод проекции градиента