В [355 и 357] соответственно для априорных и апостериорных решающих правил рассматриваются достаточные условия, при которых оптимальное значение целевой функции на смешанных стратегиях — решающих распределениях — достигается также с помощью чистых стратегий — решающих правил. [c.134]
Из рассуждений 3 вытекает, что если функции фг(о>, х). определяющие целевой функционал и ограничения задачи, выпуклы при каждом со, а X — выпуклое множество, то оптимальное значение целевого функционала, достигаемое на решающих распределениях, может быть достигнуто и на решающих правилах. Ниже установлены отдельно для случаев априорных и апостериорных решающих распределений достаточные условия, гарантирующие совпадение оптимальных значений целевых функционалов на чистых и смешанных стратегиях. [c.145]
С одной стороны, решение выгодно принимать возможно позже. При этом может быть учтено больше полезной информации и облегчается прогноз последствий решения. Другие факторы требуют ускорить выбор решения. Запаздывание с решением приводит обычно к дополнительной затрате ресурсов. Конкретное содержание задачи определяет рациональный компромисс между противоречивыми требованиями к моменту выбора решения. Во многих случаях, конечно, содержательная постановка задачи однозначно определяет характер и даже общий вид решающих правил. До сих пор мы рассматривали решение многоэтапных задач в чистых стратегиях. Естественно, что все здесь сказанное об априорных и апостериорных решающих правилах можно применительно к случаю, когда многоэтапные задачи решаются в смешанных стратегиях, повторить и для априорных и апостериорных решающих распределений. Как видно, однако, из материалов гл. 5, практические "приемы построения решающих распределений связаны с существенно более трудоемкой работой, чем вычисление соответствующих решающих правил. Во всех случаях, когда решение многоэтапных задач сводится к анализу соответствующих одноэтапных стохастических задач, вычисление оптимальных смешанных стратегий проводится согласно рекомендациям гл. 5. [c.195]
В предыдущих параграфах мы рассматривали две в известном смысле крайние информационные структуры, соответствующие априорным и апостериорным решающим правилам. Многоэтапное стохастическое программирование и развивалось главным образом применительно к этим двум схемам информированности принимающего решение. К таким информационным структурам можно естественным образом, исходя из содержательных соображений, или формальным искусственным путем сводить много различных схем задания информации, которой располагает управляющий системой на том или ином этапе выбора решения. Тем не менее при анализе практических многоэтапных задач стохастического программирования часто возникают специфические проблемы, связанные с изучением роли информации и памяти на отдельных этапах выбора решений. [c.204]
В терминах рассматриваемой задачи многоэтапные стохастические модели с априорными и апостериорными решающими правилами обладают информационными структурами Л00-1) и Л00) соответственно. [c.206]
Априорные и апостериорные решающие [c.394]
В зависимости от последовательности чередования процедур решение" или наблюдение" решающие правила и решающие распределения определяются априорной или априорной и апостериорной информацией. [c.56]
Задача стохастического программирования (3.1) -(3.3) в зависимости от вида целевого функционала (3.1) преобразуется в одноэтапную М -модель с вероятностными ограничениями, одноэтапную /"-модель с вероятностными ограничениями, одноэтапную /"-модель со смешанными условиями (для решения этих моделей используются априорные или апостериорные решающие правила) либо в одноэтапную задачу с построчными вероятностными ограничениями и решающими правилами нулевого порядка. [c.57]
Можно (рассматривать две постановки задачи сглаживания и прогноза одноэтапную и многоэтапную. В одноэтапной постановке по известным статистическим характеристикам процессов v (t) и t,(t) определяются априорные или апостериорные решающие правила, необходимые для управления наборы = , i=l, , п, сглаженных или упрежденных точек — оценок r (ti + taj. Для вычисления необходимо задать (а) класс операторов, из которых выбираются структуры механизма связи t,i со значениями, К/) на (ti—Т, ti) (б) показатель качества прогноза R(L) и (в) область Q определения —набор ограничений, высекающих множество допустимых сглаженных или упрежденных точек. [c.39]
Анализ взаимосвязи задачи прогноза и задачи управления или планирования, ради которой производится прогнозирование, подсказывает подходящие информационные структуры решения. Можно указать ситуации, в которых решение следует определять в априорных или апостериорных решающих правилах. В гл. 14 указаны случаи, когда не существует решающих правил, удовлетворяющих условиям задачи прогноза при сложных критериях качества, но решение может быть получено в решающих распределениях. [c.43]
Отношение правдоподобия дает некоторые указания на то, насколько убедительным и решающим может быть тот или иной выборочный результат. Если отношение правдоподобия равно единице, апостериорная вероятность будет просто равна априорной. Получаемая информация не будет приводить к изменению нашего мнения, если она столь же вероятна при предположении об истинности одной гипотезы, как и при предположении об истинности другой гипотезы. Чем больше отношение правдоподобия отличается от единицы, тем больше разница между априорной и апостериорной вероятностью. [c.63]
Если в соответствии с содержательным смыслом задача решается в априорных решающих правилах, то оптимальный вектор p — p j зависит только от заданных статистических характеристик случайных процессов и параметров, определяющих условия задачи. При решении задачи в апостериорных решающих правилах вектор р зависит, кроме того, и от наблюдаемых значений случайного процесса ,(t). [c.42]
При анализе модели (3.7) — (3.9) с фиксированным функциональным видом апостериорного решающего распределения целесообразно рассматривать два варианта постановки задачи. В первом варианте вектор а статистических параметров фиксированного условного распределения Fx a предполагается не зависящим от реализации случая, т. е. FX °> = F(X а м)- Во втором варианте а=а(со) и Fx.—F(x, а(со), со). Анализ первого варианта сводится к вычислению априорного решающего правила (детерминированного вектора), представляющего собой оптимальный план стохастической задачи вида (4.8) — (4.9), в которой [c.144]
При решении стохастических задач с апостериорными или априорными решающими правилами могут еще задаваться дополнительные требования на характер решающего правила вплоть до вида функциональной зависимости решающего правила от случайных параметров условий задачи. В последнем случае задача бесконечно-мерного программирования сводится к конечно-мерной задаче (или к последовательности конечно-мерных задач), в которой требуется вычислить оптимальные численные значения параметров решающего правила. Дополнительные требования к классу измеримых функций, из которых следует выбирать решение задачи (2.1) — (2.3.), могут определяться содержательными соображениями или необходимостью упростить построение и реализацию решающего правила. [c.194]
В гл. 10 намечен общий подход к построению апостериорных решающих правил задачи (6.1) — (6.3). Конструирование априорных решающих правил связано с существенно большими теоретическими и вычислительными трудностями. В 4—5 указаны пути построения априорных решающих правил для частных классов многоэтапных стохастических задач. [c.252]
В частных случаях, рассмотренных в гл. 8, для вычисления Xi — решения задачи первого этапа — имеются конструктивные приемы. В общем случае, когда задача первого этапа оказывается выпуклой и область K=Ki П Kz ее определения задана явно, можно вычислить xi по методу стохастического градиента [107]. Знание je i=J i позволяет сократить число этапов в исходной задаче на единицу. Параметры условий полученной таким образом задачи зависят от реализации MI. В некоторых задачах специальной структуры параметрические методы исключают необходимость в решении множества задач, определяемых возможными реализациями он. В общем случае требуются весьма громоздкие вычисления. Для некоторого набора реализаций он, выбор которого обусловлен структурой задачи, следует, используя, например, метод стохастических градиентов, вычислить узлы сетки (таблицы). значений x z( i), по которой можно восстановить с требуемой точностью значения составляющих x z(u)i) для произвольной реализации он. Этот процесс может быть продолжен. Однако с увеличением числа этапов трудоемкость вычислений и требования к памяти чрезвычайно быстро растут. При немалых п представляется более перспективным сведение многоэтапной задачи к вычислению апостериорных решающих правил одноэтапных задач. Если восстановление априорных решающих правил исходной задачи по апостериорным решающим правилам одноэтапной задачи связано со значительными вычислительными трудностями, целесообразно после вычисления x i рассматривать второй этап задачи (6.7) — (6.9) (при каждой реализации oi) как одноэтапную-задачу с апостериорными решающими правилами. [c.254]
Подчеркнем еще раз, что рассуждения, аналогичные приведенным, позволяют привести в соответствие каждой многоэтапной задаче с априорными решающими правилами (так же как и задаче с апостериорными решающими правилами) одноэтапную стохастическую задачу, оптимальные апостериорные решающие правила которых позволяют получить оптимальные априорные решающие правила исходной задачи.. Вопрос о том, в каких случаях целесообразнее сводить многоэтапную задачу с априорными решающими правилами к одноэтапной или двухэтапной задаче, решается в каждом отдельном случае при сопоставлении трудоемкости решения эквивалентной задачи и восстановления по ее оптимальному плану оптимальных решающих правил исходной задачи вида (6.1) — (6.3). [c.256]
Функции веса адаптивных фильтров представляют собой априорные или апостериорные динамические решающие правила, зависящие от статистических характеристик случайных функций TI(/) и. (f), устанавливаемых и уточняемых в процессе слежения за ними. [c.311]
Хотя правило выглядит очень простым, применить его на практике оказывается трудно, так как бывают неизвестны апостериорные вероятности (или даже значения упрощенных решающих функций). Их значения можно оценить. В силу теоремы Байеса апостериорные вероятности можно выразить через априорные вероятности и функции плотности по формуле Р С, Iх = Р С, (Р(х I С, / Р Су Р хI С , , [c.47]
Настоящая монография содержит пятнадцать глав. В гл. 1, носящей вводный характер, классифицируются постановки задач стохастического программирования, приводится краткая историческая оправка и излагается вспомогательный математический аппарат. Глава 2 посвящена анализу постановок различных технических и экономических прикладных задач управления в условиях неполной информации. Содержание последующих девяти глав связано с активным подходом к стохастическому программированию — (формальной основой для выбора решений в условиях неполной информации. В гл. 3—5 исследуются од-ноэтапные стохастические задачи с вероятностными и статистическими ограничениями, решаемые в чистых и смешанных стратегиях, в априорных и апостериорных решающих правилах и решающих распределениях. Главы 6—8 посвящены теории и вычислительным схемам классической двухзтапной задачи стохастического программирования. В гл. 9—11 описаны динамические модели управления в условиях неполной информации — многоэтапные задачи стохастического программирования с условными и безусловными статистическими и вероятностными ограничениями с априорными и апостериорными решающими правилами. [c.6]
В многоэтапной модели фильтрации и прогноза на i -м этапе, исходя из накопленной до сих пор информации и принятых решений, сглаживается или экстраполируется процесс т)(/) при t=ti. При этом, однако, учитывается, что критерий качества и ограничения задачи связывают между собой все оценки j, i—1,. .., п. Многоэтапная модель фильтрации и прогнозирования описывается многоэтапной задачей стохастического программирования с жесткими или условными статистическими или условными вероятностными ограничениями. В зависимости от содержательных особенностей задачи многоэтапная модель, как и одноэтап-ная, решается в априорных или апостериорных решающих правилах или решающих распределениях. [c.39]
Задача стохастического управления рассматривается как одноэтап-ная задача стохастического программирования, если описываемая моделью ситуация требует выбора закона управления для всей траектории системы (/ = 0, 1,. .., s—1) в один прием и коррекции по ходу управления в процессе накопления информации не допускаются. Априорные решающие правила определяют закон управления, зависящий только от детерминированных параметров и статистических характеристик случайных параметров условий задачи. Закон управления, определяемый апостериорными решающими правилами, зависит, кроме того, от реализации случайных исходных данных. Закон управления, соответствующий решающим распределениям, представляет собой случайный механизм формирования решения со статистическими характеристиками, зависящими (при апостериорных решающих распределениях) или не зависящими (при априорных решающих распределениях) от реализации случайных параметров условий задачи. Механизм управления, отвечающий решающим распределениям, может при одних и тех же реализациях исходных данных приводить к различным траекториям управления и, [c.45]
Настоящая глава посвящена многоэтапным стохастическим задачам с условными ограничениями и априорными решающими правилами. Качественный анализ таких задач связан с существенно большими трудностями, чем исследование стохастических задач с апостериорными решающими правилами. В общем случае для задач с априорными решающими правилами несправедливы теоремы двойственности, подобные тем, которые доказаны в предыдущей главе для задач с апостериорными решениями. Во многих случаях детерминированные эквиваленты задач с априорными решающими правилами оказываются многоэкстремальными моделями. Трудности, с которыми сопряжено исследование таких моделей, вынуждают сузить диапазон рассматриваемых задач по сравнению с кругом задач, обсуждаемых в предыдущей главе. Мы ограничимся здесь1 главным образом линейными задачами с условными вероятностными ограничениями. [c.233]