Второе направление связано с построением минимизирующей последовательности траекторий, причем в качестве независимого аргумента берется не управление, а фазовая траектория (метод вариаций в фазовом пространстве). При таком подходе легко учитываются фазовые ограничения, однако возникают другие трудности. Этому направлению также уделено сравнительно небольшое место, так как имеются монографии [57], [86], посвященные, в основном, именно этому подходу. [c.109]
М о и с е е в Н. Н. Численные методы теории оптимального управления, использующие вариации в пространстве состояний. — Кибернетика, 1966, 5, № 3, 1—23. [c.481]
Дискретный принцип максимума получается почти по такой же схеме, но вместо дифференциальных уравнений в выкладках участвуют их разностные аппроксимации. И вот здесь появляется упомянутое реальное следствие дискретной теории разностное уравнение для сопряженного уравнения является следствием того или иного выбора аппроксимаций для прямого уравнения и для интеграла в тождестве Лагранжа. Разностная аппроксимация уравнения в вариациях также однозначно определяется выбором аппроксимации исходного уравнения, но это не так важно, так как в вычислительных методах обычно это уравнение не интегрируется. Эту аппроксимацию сопряженного уравнения "мы будем называть согласованной с аппроксимациями исходного уравнения и интеграла в том смысле, что для конечно-разностных решений Sz и ф, полученных по согласованным аппроксимациям соответствующих уравнений, алгебраически точно выполняется тождество Лагранжа (тоже в соответствующей аппроксимации). Это и есть то единственное практическое следствие, которое автор смог извлечь из теории дискретного принципа максимума и которого в своих вычислениях никогда не использовал ни в явной, ни в неявной формах. Автор всегда выбирал для исходного и сопряженного уравнений независимые аппроксимации, причем сопряженное обычно интегрировалось более грубо, с большим шагом по времени. Дело в том, что использование согласованной > аппроксимации связано с определенными техническими неудобствами, необходимость преодоления которых не очевидна. Во всяком случае, автору неизвестны трудности численного решения задач оптимального управления, которые можно было бы преодолеть, используя согласованную аппроксимацию. Чтобы и здесь быть более конкретным, можно все же указать на некоторое следствие использования согласованной аппроксимации. Речь идет о получении минимума функционала с большим числом знаков. Используя для вычисления функциональной производной функцию < >, найденную по произвольной аппроксимации сопряженного уравнения, мы, разумеется, находим не точную производную, а лишь приближенную, искаженную влиянием ошибок аппроксимации. Поэтому получить минимум с очень большой точностью не удастся начиная с некоторого этапа минимизации (например, методом градиента в функциональном пространстве) мы будем в этом случав [c.54]