Лучший способ моделирования игры с последовательным выбором — использовать древо игры. Древо игры напоминает древо решений, за тем исключением, что в первом случае решение принимает не один, а большее число игроков. На рис. 4.6 приведен пример со стратегиями и результатами, иллюстрирующий описанный выше случай с новичком и старожилом. Круги на рисунке представляют собой узлы с решениями. Игра начинается с узла 1. На этом этапе Игрок 1 (новичок) выбирает между вариантами е и ё, которые можно истолковать как входить и не входить соответственно. Если выбирается последнее, тогда игра заканчивается с результатами П = 0 (результат новичка) и П2 = 50 (результат старожила). Если Игрок 1 выбирает е, мы переходим к узлу с решением 2. Этот узел соответствует выбору Игрока 2 (старожила) между вариантами гиг, которые можно истолковать как наказывать за вход и не наказывать за вход соответственно. Игры, которые, как на рис. 4.6, могут быть представлены в виде древа, называются также играми в развернутой форме . [c.64]
Для того, чтобы исключить ситуации типа (нет война, если да) мы рассмотрим "принцип последовательной рациональности" стратегия игры должна предписывать оптимальный ход в каждой вершине дерева. Т. е. если игрок находится в некоторой вершине дерева, его стратегия должна предписывать оптимальный выбор, начиная с этой точки, при данных стратегиях его оппонентов. В этом смысле [c.90]
Развитие игры во времени представляется как ряд последовательных ходов . Ходы могут быть сознательные и случайные. Случайный ход — результат, получаемый не решением игрока, а каким-либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т. п.). Сознательный ход — выбор игроком одного из возможных вариантов действия (стратегии) и принятие решения об его осуществлении. [c.150]
В предыдущем параграфе мы обосновали использование игр с одновременным выбором как реалистический способ моделирования ситуаций, в которых время ожидания действий других игроков непродолжительно, что эквивалентно одновременному выбору стратегий. Однако когда промежуток времени между выбором стратегий достаточно большой, предположение о последовательном принятии решений представляется более реалистическим. Рассмотрим пример отрасли, которая в данный момент монополизирована. Другая фирма должна решить, входить в эту отрасль или нет. В зависимости от этого решения фирма-старожил должна определиться, проводить агрессивную ценовую политику или нет. Решение монополиста является функцией решения дебютанта. Другими словами, сначала монополист наблюдает за тем, входит или нет новая фирма в отрасль, а затем принимает решение о проведении той или иной ценовой политики. В такой ситуации разумнее говорить о модели с последовательным, нежели с одновременным выбором. В частности, в модели должны присутствовать фирма-новичок — Игрок 1, — делающая первый шаг, и фирма-старожил на рынке — Игрок 2, — которая делает второй шаг. [c.64]
Заметим, что если траектория системы, т. е. последовательность ситуаций (z1, z2, z3,. ..), сходится к некоторому равновесному состоянию z, то это будет равновесие по Нэшу. Обобщением описанной схемы выбора рациональных стратегий в повторяющихся играх является так называемая гипотеза индикаторного поведения. В случае индикаторного поведения элемент использует стратегию 5 + (4.18.5) как индикатор , показывающий направление изменения предыдущей стратегии zf, и делает шаг в этом направлении. В формальной записи [c.187]
Выбранная стратегия последовательно оптимальна при данных ожиданиях, то есть выбор в каждом информационном множестве должен быть таким, чтобы максимизировать ожидаемый выигрыш в предположении, что после этого информационного множества игра будет идти в соответствии с набором стратегий (sz, з-г). [c.682]
Необходимой предпосылкой для разработки теории институтов является отделение анализа правил игры от стратегии игроков. Определение институтов как ограничений, накладываемых на себя людьми, комплементарно по отношению к идеям неоклассической теории выбора. Опираясь на идеи индивидуального выбора, теория институтов делает шаг в сторону соединения и примирения экономики и других общественных наук. Важность подхода, принятого теорией выбора, заключается в том, что в основании набора логически последовательных и потенциально верифицируемых гипотез должна лежать теория человеческого поведения. Сила микроэкономической теории в том, что она исходит из посылок об индивидуальном человеческом поведении (хотя в главе 3 будет изложена моя позиция о необходимости изменения этих посылок). Институты создаются людьми. Люди развивают и изменяют институты поэтому наша теория должна начинаться с индивида. В то же время ограничения, накладываемые институтами на человеческий выбор, оказывают влияние на самого индивида. Соединение индивидуального выбора с ограничениями, налагаемыми институтами на весь перечень выборов, является важным шагом в сторону интегрального социального анализа. [c.20]
Для каждой рационализуемой стратегии, игрок может построить последовательность "оправданий" своего выбора, без ссылок на убеждение в том, что другой игрок не будет играть НЛО стратегию. Например, в этой игре игрок 1 может оправдать выбор а-2 убеждением, что игрок 2 будет играть Ь2, которое игрок 1 может оправдать убеждением, что игрок 2 будет думать, что он собирается играть а2, что осмысленно, если игрок 1 убежден, что игрок 2 думает, что он, игрок 1, думает, что игрок 2 будет играть Ь2 и т. д. [c.39]
Как мы уже отмечали, хотя равновесный анализ доминирует в исследованиях стратегических игр, очень многих не удовлетворяет и беспокоит предположение о том, что игроки немедленно и безошибочно идентифицируют и играют определенный набор равновесных стратегий. Изучение процесса обучения является альтернативным и в некотором смысле дополняющим подходом к анализу поведения в играх. Типичный анализ рассматривает игру, разыгрываемую "повторно" (неоднократно) и постулирует некоторые специфические правила, в соответствии с которыми игроки формируют ожидания, касающиеся того, каким будет текущий выбор игроков как функция предыдущих розыгрышей. Далее предполагается, что игроки пытаются максимизировать свои текущие выигрыши при данных ожиданиях это определяет динамический процесс, порождающий последовательность розыгрышей, и анализ концентрируется на изучении поведения этой последовательности. Сходится ли такой розыгрыш Если да, то приводит ли этот подход к поведению, предсказываемому равновесным анализом [c.170]
Различие между этими ролями основано на том, что целенаправленное (активное) поведение в теории управления обычно описывается в рамках теоретико-игровых моделей. Качественное отличие иерархических игр [58,73, 107] от неантагонистических игр заключается в наличии упорядочения участников системы по последовательности выбора действий. Обычно считается, что управляющий орган (центр в теории активных систем [44], первый игрок в теории иерархических игр [58], prin ipal в теории контрактов [99,211,213, 217-221]) обладает правом первого хода, т.е. выбирает свою стратегию первым и сообщает ее другим участникам системы - управляемым субъектам (агентам, второму игроку). Участники, делающие первый ход, при этом интерпретируются как центры верхнего уровня иерархии (метацентры), участники, делающие второй ход, интерпретируются как центры промежуточного уровня (центры), а участники, выбирающие свои действия последними - как управляемые субъекты [141]. Действия метацентров могут зависеть от действий центров и агентов, действия центров - зависеть от действий агентов. [c.60]