Минимаксную и максиминную стратегии часто называют одним термином — минимаксные стратегии. [c.336]
Этот показатель является основой минимаксного критерия Сэвиджа, согласно которому выбирается такая стратегия S,, при которой величина риска принимает минимальное значение в самой неблагоприятной ситуации [c.337]
Этот показатель является основой минимаксного критерия Сэвиджа, согласно которому выбирается такая стратегия S,, при [c.645]
Критерий минимаксного риска Сэвиджа. Здесь выбирают ту стратегию, при которой величина риска имеет минимальное значение в самой неблагоприятной ситуации s = min max г.. ( [c.154]
С математической точки зрения деловые игры представляют собой общий случай стратегических матричных игр, в которых по определенным правилам находится оптимальная (минимаксная) стратегия. Необходимым условием игры является наличие противоречия или конфликта между сторонами в системе управления. Взаимодействие участников игры обусловлено специальными правилами. Эти правила выражают права и обязанности сторон, зафиксированные в действующих законодательных актах (постановлениях, приказах, инструкциях и т. п.). Важной составляющей деловых игр является информация, на основе которой (в соответствии с правилами игры) принимаются решения. Кроме того, в деловых играх предусматриваются критерии деятельности участников, по которым производится оценка эффективности принимаемых решений. [c.115]
Однако и игрок У будет рассуждать совершенно аналогично. Он найдет сначала для себя наибольшие проигрыши по всем стратегиям противника, а затем из этих максимальных проигрышей выберет минимальный, т.е. минимаксную точку, обозначаемую так [c.111]
Развитием критерия М. является критерий минимаксных потерь ("критерий Сэвиджа", правило наименьшего риска). В соответствии с этим правилом для каждого столбца платежной матрицы рассчитывается разность между значением строки и максимальным значением ("риск") платежная матрица преобразуется в матрицу потерь. К ней применяется минимаксный критерий выбору подлежит стратегия, которая минимизирует наибольший риск. [c.198]
Минимаксное решете соответствует стратегии, при которой максимальное сожаление минимально. В нашем случае для линии малой мощности максимальное сожаление составляет 150 (в ситуации высокого спроса), а для линии большой мощности —100 (при отсутствии спроса). Поскольку 100 < 150, минимаксное решение — построить линию большой мощности. Минимаксный критерий ориентируется не столько на фактические, сколько на возможные потери или упущенную выгоду. [c.187]
Таким образом, разумной стратегией игрока 2 можно считать ту, при которой наибольшие его потери окажутся минимальными. Такой принцип оптимальности, основанный на минимизации максимальных потерь, называется принципом минимакса, а выбираемая в соответствии с этим принципом стратегия игрока 2 — его минимаксной стратегией. Заметим, что принимаемый игроком 2 принцип минимакса является таковым с точки зрения игрока 1 с собственной же точки зрения игрока 2, оценивающего свой выигрыш — Я, его следовало бы называть также принципом макси-мина. Поэтому часто говорят об использовании принципа максимина обоими игроками в антагонистической игре. После сделанной оговорки употребление этого оборота не должно будет приводить нас к недоразумениям. Минимаксные потери игрока 2 в игре Г будут равны [c.29]
Поэтому разумное, минимаксное поведение игрока 2 в простой игре должно состоять в наиболее редких укладках v-сечений в множестве стратегий игрока 1. [c.147]
Противоречие между осуществимостью ситуации, выражаемой в виде равновесности и ее выгодностью, которой соответствуют оптимальность по Парето, имеет по существу ту же природу, что и противоречие между максиминным и минимаксным выигрышами. Поэтому оно должно разрешаться при помощи аналогичных приемов, состоящих в расширении множеств уже имеющихся стратегий. Следующие два параграфа мы посвятим этому вопросу. [c.186]
Величина /3 называется верхней ценой игры, а соответствующая ему стратегия Bio — минимаксной. [c.92]
Принцип осторожности, диктующий игрокам выбор стратегий максиминной ими минимаксной соответственно, в теории игр именуют принципом минимакса , а сами стратегии максимин-ные и минимаксные — общим термином минимаксные стратегии . [c.92]
Если же игра повторяется неоднократно, то постоянное применение минимаксных стратегий становится неразумным. Например, если игрок В будет уверен в том, что на следующем ходу А применит прежнюю стратегию, то он несомненно выберет стратегию, отвечающую наименьшему элементу в этой строке, а не прежнюю. [c.93]
Хотя ситуация неопределенности предполагает, что максимизация дохода не является надлежащей целью или критерием, она не предполагает, что рациональное поведение не будет эффективно. Имитация, адаптация и инновация являются примерами рациональных стратегий в условиях неопределенности. Можно сформулировать субъективные мнения относительно вероятности, но эластичность, диверсификация и пределы безопасности также будут использованы. Все они являются элементами минимаксной стратегии. Они также включают в себя формулировку суждений и испытывают влияние систем предпочтения полезности тех, кто принимает решение. Иногда возникает более значительная неопределенность обеспечения возможности достижения большего дохода или чистых поступлений, т. е. в данном случае возможность максимальной потенциальной потери, вызываемая теми, кто хочет пойти на риск, для одних будет больше или меньше, чем для других.63 [c.482]
Обратным по содержанию критерию максимина является минимаксный критерий, величина которого называется верхней ценой игры. Традиционно этому понятию соответствует максимальный проигрыш, на который может рассчитывать игрок, выбрав для себя одну из своих стратегий в расчете на [c.56]
Эта величина называется верхней ценой игры, или мини-максом, а соответствующие условия состояния среды или стратегия противника-игрока (природы) - минимаксными. При наихудшем исходе из всех наилучших исходов по каждой [c.72]
Критерий минимаксного сожаления (принцип Сэвиджа). Стратегия выбора по принципу Сэвиджа характеризует те потенциальные потери, которые фирма будет иметь, если выберет неоптимальное решение. Детализированная процедура выбора в этом случае производится в три этапа. [c.107]
Величина В называется верхней ценой игры, иначе - минимаксным выигрышем или минимаксом. Соответствующая выигрышу В стратегия называется его минимаксной стратегией. [c.163]
Принцип осторожности, диктующий игрокам выбор соответствующих стратегий (максиминной и минимаксной), является в теории игр основным принципом и называется принципом минимакса. [c.163]
В платежной матрице игры существует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце. Такой элемент называют седловой точкой. Седловая точка в игре имеет место тогда, когда наблюдается равенство б = В. При этом значение б = В = V называют чистой ценой игры. В этом случае решение игры (совокупность оптимальных стратегий игроков) обладает следующим свойством если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии. Поэтому для игры с седловой точкой минимаксные стратегии обладают устойчивостью. [c.163]
Игровой (минимаксный) подход. Этот подход широко применяется в теории игр. Он состоит в максимизации выигрыша игрока при условии, что его соперник тоже применяет оптимальную стратегию (старается минимизировать выигрыш соперника). [c.150]
Минимаксная стратегия широко распространена в таком разделе теории операций как теория игр. В определенном смысле робастная процедура — это игра исследователя с природой. [c.185]
Критерий Вальда (минимаксный или максиминный критерий), основанный на принципе наибольшей осторожности. В случае когда результат У7 представляет собой потери, при выборе оптимальной стратегии используется минимаксный критерий. Требуется на первом этапе в каждой строке найти наибольший элемент тах V- , а далее выбирается действие R. (строка/), которому будет соответствовать наименьший элемент из этих наибольших элементов [c.311]
В общем случае ситуация в максиминных стратегиях не всегда является равновесной. Это заставляет игроков адаптироваться друг к другу, выдвигать последовательно усложняющиеся гипотезы об ответных реакциях конкурента и собственных контрмерах. Такое поведение называют рефлексивным. Оно побуждает каждого игрока отклоняться от своей макси-минной (минимаксной) стратегии с целью улучшения значения выигрыша в свою пользу. В таком случае первый игрок может только предполагать, как поступит второй будет ли он придерживаться своей максиминной стратегии Ь или отклонится от нее. В значительной степени на решения игроков по-прежнему будут влиять их личностные качества, величина предполагаемого выигрыша v(a, b ), а также их искусство блефовать и рефлексировать. В конечном итоге выиграет тот, кто более искусно маскировал свои истинные намерения и удачнее предсказал намерения своего соперника. [c.243]
При анализе антагонистических игр мы отмечали, что уклонение любого из игроков от ситуации равновесия, в то время как другой продолжает придерживаться своей макси-минной (или минимаксной) стратегии, приводит к ухудшению положения "уклониста" и одновременно — к улучшению значения выигрыша у рационально поступающего игрока. [c.245]
Критерий Вальда (минимаксный или максиминный критерий). Применение данного критерия не требует знания вероятностей состояний Sj. Этот критерий опирается на принцип наибольшей осторожности, поскольку он основывается на выборе наилучшей из наихудших стратегий RJ. [c.324]
Если в исходной матрице (по условию задачи) результат Vjt представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии RJ необходимо в каждой строке матрицы результатов найти наибольший элемент max Ид , а затем [c.324]
Таким образом, наилучшей стратегией развития провозных возможностей в соответствии с минимаксным критерием лучшим из худших будет третья, т. е. Л3. [c.325]
Это означает, что / есть разность между наилучшим значением в столбце / и значениями Vjt при том же /. Отметим, что независимо от того, является ли Vjt доходом (выигрышем) или потерями (затратами), / в обоих случаях определяет величину потерь лица, принимающего решение. Следовательно, можно применять к TJI только минимаксный критерий. Критерий Сэвиджа рекомендует в условиях неопределенности выбирать ту стратегию RJ, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален). [c.325]
Величина Р называется верхней ценой игры. Ей соответствует минимаксная стратегия второго игрока. Величина Р представляет собой гарантированный проигрыш второго игрока при любой стратегии первого игрока. [c.330]
Величина Р = 6 д. е. будет гарантированным проигрышем игрока В при любых стратегиях игрока А. Выбранная игроком В вторая стратегия называется минимаксной стратегией, а соответствующее ее значение проигрыша Р2 = 6 д. е. будет верхней ценой игры. [c.331]
Когда стратегии Р и gf оптимальны, то выполняется строгое равенство между максиминным ожидаемым выигрышем и минимаксным проигрышем, а результирующее значение равно оптимальному (ожидаемому) значению игры. [c.334]
Соответственно, если Игрок 2 придерживается своей минимаксной стратегии, его проигрыш будет не больше минимаксного значения (называемого верхней ценой игры), т.е. [c.223]
Эта величина называется верхней ценой игры, или минима-ксом, а соответствующие условия состояния среды или стратегия противника-игрока (возможного конкурента) — минимаксной. При наихудшем исходе из всех наилучших исходов действия по каждой стратегии противник = игрок гарантирует, что проиграет, или природа (состояние спроса и предложения) даст возможность выиграть не больше, чем ft = 4200. [c.336]
Установленный факт означает, что если игра одноходовая, то есть партнеры играют один раз, выбирая по одной чистой стратегии, то в расчете на разумно играющего противника они должны придерживаться принципа минимакса, это гарантирует выигрыш F> а игроку А и проигрыш F< /3 игроку В. Следовательно, при применении минимаксных стратегий величина платежа V ограничена неравенством а < F< /3. [c.93]
В условиях неполной информации необходимо принять некую форму минимаксной стратегии.60 Даже в стохастическом случае, где лицо, принимающее решение, знает данные, позволяющие ему дать оценку распределений вероятности альтернативных результатов, оно сделает статистические ошибки (типа 1 или типа 2).61 Таким образом, все статистические решения являются минимаксными процедурами. Там, где допускаются только две гипотезы (Л0 и AJ), мы имеем дело со специальным случаем, в котором hl выражает все неблагоприятные исходы.62 При условии неполной информации индивид минимаксимизирует свою позицию долгосрочного дохода фирма минимаксимизирует свою позицию долгосрочных поступлений. [c.482]
В игре двух лиц с нулевой суммой игрок А, выбирая стратегию, учитывает, что игрок В может действовать наихудшим для игрока А способом. В этом случае игрок А при использовании каждой отдельной стратегии получит минимальный для этой стратегии выигрыш. Естественно поэтому считать оптимальной для игрока А такую его стратегию, в к-рой его минимальный выигрыш максимален. Такой выигрыш, представляющий максимум из минимумов, наз. м а к-с и м и н о м. С другой стороны, игрок В учитывает, что если игрок А действует наилучшим для себя способом, проигрыш игрока В будет максимальным. Поэтому он стремится найти такую стратегию, в к-рой его макс, проигрыш был бы минимальным, т. е. ищет минимум из максимумов, или м и н и м а к с. Во многих играх величина минимакса совпадает с величиной максимина при использовании только чистых стратегий. Такие игры наз. играми с седповой точкой. Максиминная стратегия для игрока А и минимаксная стратегия для игрока В являются для них оптимальными, причем, если игрок А отступит от максимиппой стратегии, уменьшится проигрыш игрока В, а если игрок В отступит от своей минимаксной стратегии, увеличится выигрыш игрока А. [c.154]
Равенство (I) выполняется лишь при наличии в платёжной матрице (а ) с о д л о в о г о элемента яар наименьшего в своей строке Аа и одновременно наибольшего в своём столбце В . Стратегия Аа называется макеимшшой для А, стратегия В — минимаксной для В, а величина седлового элемента aa р — ценой игры. Выбор этих стратегий противниками обеспечивает каждому нз них получение своего наилучшего гарантированного результата. Получающаяся при этом еед-лован ситуация (Аа, В ) имеет характер равновесия каждому из игроков не следует изменять стратегию, если противник не меняет своего выбора, т. к. отклонение от неё не даёт ему никакого выигрыша, а приведёт лишь к проигрышу. Стратегии Аа, В а, приводящие к ситуации равновесия, наз. оптимальными. Со-отпетстнующая им цена игры aa о — не результат сделки соперников, а компромисс, достигнутый в процессе их взаимодействия. Соперники могут не скрывать друг от друга своих оптим. стратегий при наличии сед-лоной точки если В знает оптим. стратегию Л игрока А, то никакого преимущества от этого он не получает, т. к. не может уменьшить выигрыш аа противника, поскольку аа р — наименьшее число в строке Аа. В приведённом примере конкурентной борьбы компании A u H платёжная матрица имеет седловой элемент л.,, - 00%, следовательно, оитим. стратегиями игроков являются А,, и В, т. е. стр-во компаниями новых магазинов но 2-м городе, где компания А захватит 00% оборота. [c.113]