Аппроксимация оптимального управления

В задачах оптимального управления ситуация несколько иная. Здесь решение не есть информация о мире, оно является лишь рекомендацией о наиболее эффективном поведении (управлении). Поэтому неопределенность ответа не очень страшна. Более того, если обнаруживается, что существует мощное семейство управлений, приводящих к одним и тем же практически оптимальным результатам, то это следует расценивать как благоприятное обстоятельство ведь этим облегчается задача аппроксимации оптимального управления фактически реализуемыми средствами. Наконец, отметим связь используемого в наших расчетах метода регуляризации с одной идеей решения экономических задач. Часто в экономике возникают задачи, в которых нужно минимизировать не один показатель (функционал) F0(u), а несколько Од(и) Р ,ъ (u)> > причем они занумерованы (вторым индексом) в порядке важности. Достаточно осмысленный подход к подобным зада-  [c.355]


Необходимость изучения задачи (18) аргументируется, в частности, потребностями численного решения задач оптимального управления ведь численные методы имеют дело не с дифференциальными уравнениями, а с их разностными аппроксимациями  [c.53]

Дискретный принцип максимума получается почти по такой же схеме, но вместо дифференциальных уравнений в выкладках участвуют их разностные аппроксимации. И вот здесь появляется упомянутое реальное следствие дискретной теории разностное уравнение для сопряженного уравнения является следствием того или иного выбора аппроксимаций для прямого уравнения и для интеграла в тождестве Лагранжа. Разностная аппроксимация уравнения в вариациях также однозначно определяется выбором аппроксимации исходного уравнения, но это не так важно, так как в вычислительных методах обычно это уравнение не интегрируется. Эту аппроксимацию сопряженного уравнения "мы будем называть согласованной с аппроксимациями исходного уравнения и интеграла в том смысле, что для конечно-разностных решений Sz и ф, полученных по согласованным аппроксимациям соответствующих уравнений, алгебраически точно выполняется тождество Лагранжа (тоже в соответствующей аппроксимации). Это и есть то единственное практическое следствие, которое автор смог извлечь из теории дискретного принципа максимума и которого в своих вычислениях никогда не использовал ни в явной, ни в неявной формах. Автор всегда выбирал для исходного и сопряженного уравнений независимые аппроксимации, причем сопряженное обычно интегрировалось более грубо, с большим шагом по времени. Дело в том, что использование согласованной > аппроксимации связано с определенными техническими неудобствами, необходимость преодоления которых не очевидна. Во всяком случае, автору неизвестны трудности численного решения задач оптимального управления, которые можно было бы преодолеть, используя согласованную аппроксимацию. Чтобы и здесь быть более конкретным, можно все же указать на некоторое следствие использования согласованной аппроксимации. Речь идет о получении минимума функционала с большим числом знаков. Используя для вычисления функциональной производной функцию < >, найденную по произвольной аппроксимации сопряженного уравнения, мы, разумеется, находим не точную производную, а лишь приближенную, искаженную влиянием ошибок аппроксимации. Поэтому получить минимум с очень большой точностью не удастся начиная с некоторого этапа минимизации (например, методом градиента в функциональном пространстве) мы будем в этом случав  [c.54]


Все эти рассуждения на первый взгляд не имеют отношения к приближенному решению задач оптимального управления. Ведь в любой реализации приближенного метода имеют дело не с измеримой функцией, а, например, с кусочно постоянной сеточной. В этом случае разница между функционалами (4) и (9) пропадает, и появляется формальная возможность и для учета (9) использовать аппроксимацию (10). Именно такая точка зрения принята в [31], [68], [75] и других работах, связанных с применением методов математического программирования (см. также 13, 25, 36). К сожалению, этот единообразный подход к объектам разной функциональной природы оплачивается существенным ростом объема вычислений и, вследствие этого, ненадежностью результатов. В данном случае он приведет к очень большому числу точек аппроксимации t в (10). -  [c.78]

Решение этой задачи в принципе не так уж сложно — алгоритм дискретного динамического программирования, подробно описанный в 44, приводит к цели с затратой числа операций в общем случае порядка О (Nh 2n). Последовательность точек (6) и объявляется оптимальной траекторией задачи (1) — (5) разумеется, речь идет о приближенно оптимальной траектории, точность зависит от шагов сетки т и А. Если элементарная операция реализована точным решением задачи типа (1) — (5) на малом интервале [t(, tt+1], то мы имеем дело с точной траекторией управляемой системы (2), проходящей через узлы ж/, в моменты tf обычно элементарная операция реализуется не абсолютно точно, и узлы (6), соединенные, например, отрезками прямых, представляют некоторую аппроксимацию решения системы ж=/. Если нас интересует не только оптимальная траектория (6), но и реализующее ее управление и (t), то его можно восстановить по узлам (6) с помощью той же элементарной операции. Следует прежде всего подчеркнуть ту легкость, с которой данный метод справляется со всеми ограничениями на фазовую часть траектории, будь то ограничения на правом конце траектории (х (Т)=Х1) или еще более сложные ограничения типа х (t) G при всех t. В известной монографии [57] отражена история развития методов приближенного решения задач оптимального управления группой ВЦ АН СССР под руководством Н. Н. Моисеева. Работа начиналась с естественной попытки строить минимизирующие последовательности управляющих функций. После первых успехов в решении простейших неклассических задач (это — задачи, содержащие только ограничение типа u U без условий на правом конце траектории в [40] опубликовано решение задачи о максимальной дальности планирования) встретились определенные трудности, связанные с огра-  [c.122]


Основным содержанием настоящего параграфа является алгоритм динамического программирования, позволяющий эффективно решать специальные дискретные задачи оптимального управления. Такие задачи могут появляться при оптимизации дискретных систем и при аппроксимации задач оптимального управления (см., например, 15).  [c.386]

Для задач оптимального управления, которые при конечно-разностной аппроксимации становятся задачами min F[u] в про-  [c.476]

Предложены методы решения задачи выбора вектора управления поликорпоративной системой среди управляющих воздействий, во-первых, с использованием аппроксимации множества Парето, во-вторых, путем последовательного сопоставления оптимальных значений критериев на графе Парето-оптимальных управлений, разработаны алгоритмы формирования управления.  [c.114]

Предложен метод выбора вектора управления поликорпоративной системой с использованием аппроксимации множества Парето. Разработанный метод многокритериального выбора по сравнению с непосредственным применением принципа максимина позволяет избежать дифференцирования функции максимума (минимума) для выбора компромиссно-оптимального управления это преимущество особенно важно с учетом того, что функция максимума (минимума) непрерывно дифференцируема не на всей области определения. Применение данного метода в виде формирования минимизирующей последовательности управлений сводит решение многокритериальной задачи управления к последовательности решения скалярных задач оптимизации, для которых разработаны надежные численные методы решения. Использование предложенного метода наряду с получением конечного практически значимого результата - выбора минимаксно-оптимального управления - позволяет получить обширную информацию о структуре множества Парето ценность этой информации заключается в том, что сопоставление минимаксно-оптимального управления с другими элементами множества Парето является инструментом оценки качества этого  [c.146]

Осуществлен синтез управления корпоративной системой Ульяновского авиационно-промышленного комплекса на основе единых методологических подходов комплексного согласования экономических интересов участников взаимодействий, рассмотренных во второй главе, и методов многокритериального выбора, предложенных в третьей главе. Полученные результаты подтвердили эффективность методов аппроксимации множества Парето и последовательного сопоставления оптимальных значений критериев на графе Парето-оптимальных управлений при формировании управления корпоративной системой.  [c.203]

Решая N уравнений (17) вместе с т уравнениями (15 ) относительно N -m неизвестных sa , Х1 А2,. . ., Хт при каком-то фиксированном значении Х , получим решение, удовлетворяющее всем условиям задачи, за исключением (16 ). Проделав подобные вычисления для нескольких значений Х0, подберем нужное значение )i0 из условия (16 ), которое, кстати, может быть удовлетворено с не очень высокой точностью. Однако самым неприятным моментом всего алгоритма является необходимость решения систем линейных алгебраических уравнений высокого порядка N. Этим объясняется, видимо, тот факт, что в известных автору работах метод второго порядка использовался на сравнительно грубых сетках с небольшим значением N 10- -20. Если исходная вариационная задача содержит условие и (t) U, и в (16 ) берется первый вариант ограничений на sn, задача также оказывается вычислительно очень сложной при больших N. Таким образом, проявляется своеобразная противоречивость методов второго порядка. Имея целью в основном повысить эффективность поиска вблизи минимума и получить меньшее значение функционала, чем это удается сделать методами первого порядка, методы второго порядка, реализованные на грубых сетках невысокой размерности, теряют в точности именно из-за грубости аппроксимации, из-за сужения задачи на пространство управлений, не допускающее очень точного приближения искомого оптимального и (t).  [c.209]

Перейдем к результатам. Первый расчет проводился при /7=10 и ограничении на вариацию управления u(t) < 0,016, т. е. в тех же условиях и при той же начальной траектории, что и в соответствующем расчете 37. Вариация управления проводилась методом проекции градиента (см. 18). Заметим, что для перехода от исходного управления к оптимальному нужно изменить и (t) на величину порядка 0,3—0,4. При шаге 8мя 0,016 это в принципе можно сделать за 25 шагов, что и наблюдается в наших расчетах в 37. Результаты расчетов, использующих аппроксимацию (2), приведены в табл. 1, где показаны следующие величины v — номер итерации, значения Flp) и F0 = шах Ф [х (t)]. Величина  [c.340]

Подобное соотношение выполняется уже после нескольких первых итераций, однако в целом управление еще не оптимально. Знак ">о W+g"7 ( ) становится на ( , а), по существу, случайной величиной, зависящей, в частности, и от погрешностей конечно-разностной аппроксимации дифференциальных уравнений. Следовательно, и u (t) на (tlt t2) становится, в известной мере, случайной. В сочетании с некорректностью задачи эта случайность и приводит  [c.350]

Адекватность плановых показателей реальной действительности обеспечивается, во-первых, увеличением числа учтенных факторов при прогнозировании альтернативных плановых показателей, во-вторых, снижением ошибки аппроксимации или повышением точности прогнозов. Согласованность плана с параметрами внешней среды системы управления устанавливается с помощью анализа динамики факторов внешней среды и исследования влияния этих факторов на плановые показатели. Вариантность плана связана с разработкой не менее трех альтернативных вариантов достижения одной и той же цели и выбора оптимального ва-  [c.162]

Вычислительные методы так или иначе связаны с аппроксимацией функциональных пространств конечномерными. Эффективность метода существенно зависит от того, как используется конкретная функциональная природа того или иного объекта. В задаче оптимального управления объединены объекты с разными функциональными свойствами дифференцируемая функция х (t), измеримая и (t), дифференциальные связи, интегральные связи, функционалы, дифференцируемые по Фреше и дифференцируемые лишь по направлениям среди последних есть функционалы типа max Ф [х (t)], а есть существенно другие max Ф lx (t), и (t)]. Каждый из объектов требует своего подхода. На разностном уровне различия между этими объектами, на первый взгляд, стираются, и есть возможность все их трактовать единым образом. Именно эта точка зрения лежит в основе методов математического программирования в оптимальном управлении (см., например [75]). Однако при реализации таких единообразных подходов в достаточно сложных задачах она приводит к серьезным трудностям (см. в связи с этим 25, 34, 36).  [c.113]

Обоснование метода мы начнем с обсуждения близкой, но все же существенно отличающейся от метода Н. Н. Моисеева, схемы приближенного решения задач оптимального управления. Имеется в виду популярное в теоретических исследованиях сведение к задаче математического программирования. Вводится сетка 0, ,. . ., tjf, уравнения, функционалы и ограничения заменяются соответствующими разностными аппроксимациями на сеточных функциях (х( 0, Ий-vJf ,1- Так получаем задачу найти сеточную траекторию из условий  [c.123]

Хотя для решения задачи линейного программирования существуют четкие конечные методы (они описаны в 47), не прекращается работа по созданию итерационных, приближенных методов. Для этого есть по крайней мере две причины. Дело в том, что реализация симплекс-метода встречает определенные трудности в экономических задачах высокой размерности (N, т 103). В таких задачах работа с матрицей объемом 108 ячеек памяти становится очень сложной. В то же время исходная матрица задачи, будучи слабо заполненной, часто может быть размещена в оперативной памяти машины. Встречаются задачи, элементы матрицы которой можно вообще не запоминать, а вычислять по сравнительно простым формулам. В таких ситуациях итерационные методы, не преобразующие исходной формы задачи и не порождающие новых объектов типа матрицы общего положения (как, например, биорто-гональный базис ф ), несмотря на значительно меньшую надежность, могут оказаться предпочтительными и даже единственно реализуемыми. Для нас же будет важна и другая причина, заставляющая обратиться к итерационным методам. Ведь задачи линейного программирования, возникающие при решении задач оптимального управления, являются конечно-разностными аппроксимациями континуальных задач найти функцию 8u (t) из условий  [c.437]

Будак Б. М., Б е.р к о в и ч Е. М., Соловьева Е. Н. О сходимости разностных аппроксимаций для задач оптимального управления. — ЖВМ и МФ, 1969, 9, № 3.  [c.479]

Управление, оптимальное по критерию (3.12), может быть получено путем аппроксимации поверхности i3f П ) (рис. 3.1), образованной сочетаниями критериев при Парето-оптимальных управлениях в К-мерном пространстве критериев. В соответствии со свойствами [74] множества Парето поверхность " ( П ) строго монотонна, представляет собой левую нижнюю границу множества Ф и расположена в первом координатном ортанте. Поверхность (П) является выпуклой в том случае, если множество Ф выпукло. В этом случае поверхность " ( П ) может быть аппроксимирована гиперболической поверхностью.  [c.120]

Особенности применения метода аппроксимации. Решение многокритериальной задачи на основе метода аппроксимации множества Парето сводится к последовательности скалярных оптимизационных задач и предусматривает а) формирование К Парето-оптимальных управлений б) построение в соответствии со значениями критериев при этих управлениях гиперболических поверхностей (кривые Pi,ri 1 на рис. 3.1),  [c.127]

Динамическое программирование непосредственно ориентировано на решение дискретных задач однако его можно использовать и для задач, в которых все переменные непрерывны. В этих случаях непрерывная область пространства решений дискретизуется и отыскивается оптимальное управление. Затем в его окрестности используется более мелкая сетка, и т.п. Непрерывные функции заменяются аппроксимациями по ряду дискретных точек. Доказанная вогнутость или выпуклость функций дохода (затрат) существенно ограничивают перебор.  [c.149]

Необходимо отметить, что в задачах планирования, в отличие от классических задач управления, не возникает необходимость определения непрерывной траектории функционирования. Приемлемая в практических ситуациях точность плановых расчетов обеспечивается кусочно-постоянной аппроксимацией непрерывных функций времени. При решении задачи календарного планирования нефтеперерабатывающих производств весь плановый период разбивается на ряд одинаковых временных отрезков, на каждом из которых решение представляет собойлибо постоянное по времени у-правление, либо среднюю или интегральную величину управляющих переменных. Точность и время решения задачи зависят от длительности этого отрезка времени. При прочих равных условиях его уменьшение ведет к повышению точности решения и снижению потерь оптимальности за счет повышения точности аппроксимации параметров модели. Одновременно происходит увеличение затрат времени на решение задач в связи с увеличением частоты ее решения.  [c.77]

См. также Адаптивность плана, Алгоритмическая сеть, Аппроксимация производства то-техиологических возможностей, Внутризаводские задачи оптимального планирования, Горизонт планирования, Декомпозиционное тонирование, Задача планирования, Комплексная народнохозяйственная программа, Композиционное планирование, Корректировка плана, Маневренность плана, Марковский таи, Межотраслевой комплекс, Метапланирование, Надежность тана, Оптимальное планирование, Оптимальный тан, Оптимизируемая система, Отраслевые задачи оптимального планирования развития и размещения отраслей, Перспективное оптимальное тонирование, План, "Планирование— программирование — финансирование ", Планово-экономическая задача, Потенциально-оптимальный вариант (план), Программирование (экономическое), Программно-целевые методы тонирования и управления, Система комтекспого планирования, Согласование плановых решений, Целевая комплексная программа.  [c.264]

Итак, вместо задачи (1) — (4), в которой был лишь один функционал F0, не имеющий производной Фреше, мы получили задачу с тремя функционалами, F0, Ръ Рг, дифференцируемыми лишь по направлениям, и с одним, дифференцируемым по Фреше, функционалом F3. Правда, в новой задаче нет геометрических ограничений на управление, но учет таких ограничений менее всего затруднителен в расчетах. Однако это усложнение было оправдано, объяснить причины удобнее несколько позже. Задача решалась по схеме 19 — 21. Сетка для управления состояла из 64 точек, причем из них 50 приходилось на активный участок [О, Т], остальные — на пассивный (Т, Т ). Интегрирование самой системы (6) осуществлялось с шагом, заметно меньшим шага сетки для управления. Вариация функционала F0 аппроксимировалась тремя точками tf, для аппроксимации / и Fz использовалось по две точки. Нужно иметь в виду, что отсутствие производных Фреше у F0, Flt F% есть существенное обстоятельство, так как оптимальная и близкие к ней траектории имеют следующую структуру определим на [О, Т ] множества  [c.298]

Его содержательный смысл связан с требованием иметь дело с критическими системами. Напомним, что в (4) А — крайняя точка спектра оператора (1). Если и ( ) определяет оператор (1) с X ]> 1, то соответствующая система подкритична и в ней ядерная реакция затухает при X < 1 система надкритична и взрывается . Функционал F0 [и ( )] не имеет производной Фреше, так как в оптимальной (и в близких к ней) ситуации максимум в (3) достигается на интервалах, сравнимых с [Тг, Tz]. Кроме того, в выражение (3) явно входят компоненты управления. С этим связаны определенные трудности аппроксимация приращения функционала формулой типа  [c.330]

Приближенное решение задач оптимального управления (1978) -- [ c.268 , c.308 , c.349 , c.355 ]