Стратегии в повторяющихся играх

Заметим, что если траектория системы, т. е. последовательность ситуаций (z1, z2, z3,. ..), сходится к некоторому равновесному состоянию z, то это будет равновесие по Нэшу. Обобщением описанной схемы выбора рациональных стратегий в повторяющихся играх является так называемая гипотеза индикаторного поведения. В случае индикаторного поведения элемент использует стратегию 5 + (4.18.5) как индикатор , показывающий направление изменения предыдущей стратегии zf, и делает шаг в этом направлении. В формальной записи  [c.187]


В разовых играх стратегии легко поддаются определению. Они фактически тождественны действиям. Однако в повторяющихся играх полезно разделять действия и стратегии. Рассмотрим разовую игру на рис. 4.10. В ней у каждого игрока есть выбор из трех действий/стратегий Т, М, В у Игрока 1 и L, С, R у Игрока 2.  [c.68]

Теперь давайте выведем состояния равновесия в повторяющейся игре. При первом наблюдении обнаруживается, что повторяющиеся в разовых играх взаимодействия равновесных стратегий формируют общее состояние равновесия в повторяющейся игре. Так, например, (А/, С) в обоих периодах является равновесной стратегией. Подразумеваемыми стратегиями, образующими состояние равновесия в повторяющейся игре, для Игрока 1 должны стать выбор Мз периоде 1 и выбор Мъ периоде 2 независимо от исхода периода 1 . Аналогично можно вывести стратегии Игрока 2. Таким образом, игроки выбирают стратегии, не зависящие от осуществляемых действий.  [c.69]


Теперь проверим, образуют ли эти стратегии равновесие в повторяющейся игре. Если период 1 закончился результатом (Т, L), то в периоде 2 в соответствии с намеченными выше стратегиями игроки должны выбрать (М, Q. Поскольку эти действия образуют равновесие Нэша в разовой игре, то в интересах игроков выполнить их еще раз во втором периоде двухпериодной повторяющейся игры. Другими словами, ни один игрок не в состоянии увеличить свой выигрыш, выбрав иной вариант. Аналогично, если  [c.69]

На рынке действуют два продавца с идентичными производственными функциями. Они заключают соглашение о разделе рынка. Если обе фирмы будут следовать соглашению, их прибыль будет составлять по 80 млн. руб. ежегодно. Если обе фирмы нарушат соглашение, они получает прибыль по 30 млн. руб. Если одна фирма нарушит соглашение, а вторая нет, то нарушитель получает 150 млн. руб. прибыли, а соблюдавшая соглашение сторона -10 млн. руб. Какие стратегии фирм формируют Парето-рав новее ие Что будет служить равновесием по Нэшу в неповторяющейся игре в повторяющейся игре Почему для ответа на последний вопрос важно знать значение дисконтирующего множителя вероятности повторных продаж  [c.161]

Чтобы понять, почему гораздо проще обеспечить координацию совместных действий в повторяющихся играх, вернемся к нашим дуополистам Джеку и Джилл. Напомним, что Джек и Джилл хотели бы установить монопольный объем предложения на рынке воды городка, при котором каждый производит по 30 галлонов питьевой воды, но эгоистический интерес подталкивает их к увеличению объема выпуска до 40 галлонов. Данная ситуация представлена на рис. 16.7. Производство 40 галлонов воды — доминирующая стратегия для каждого игрока.  [c.363]

Доминирующими в этой игре могут быть по крайней мере две стратегии. (В действительности в бесконечно повторяющейся игре стратегий может быть гораздо больше, однако доминирующими могут быть в разных условиях только эти две.)  [c.145]


Анализу эффективности игровых стратегий было посвящено исследование политолога Роберта Аксельрода. Он организовал турнир, участники которого присылали судье самостоятельно разработанные компьютерные программы, играющие в повторяющуюся дилемму заключенных . Каждая программа играла против всех остальных программ. Победителем становился участник , получивший наименьшее суммарное количество лет тюремного заключения.  [c.365]

Чтобы показать, что это есть равновесие по Нэшу в бесконечно повторяющейся игре, предположим, что i -ый игрок использует триггерную стратегию, и покажем, что если S достаточно близко к 1, то для j-ого игрока лучшим ответом будет тоже применять такую стратегию. Так как игрок i будет играть Li всегда, как только на каком-то шаге исход отличается от ( Ri, R2), то лучшим ответом j-ого будет тоже играть LJ всегда после нарушения ( Ri, R2)- Т.е. осталось определить лучший ответ j -ого игрока на 1-ом шаге и на всех шагах таких, что все предыдущие были ( Ri, R2) Игра LJ даст 5 на этом шаге, но переключит на "некооперативное поведение" игрока i (а значит и j ) навсегда. Следовательно, на любом будущем шаге выигрыш будет 1 так как 1+ + 2+ + = 1/(1 — ), то приведенная стоимость последовательности выигрышей есть 5 + + 2 + --- = 5 + .  [c.111]

УСРЕДНЕНИЕ СТРАТЕГИИ БИРЖЕВОЙ ИГРЫ — приобретение ценных бумаг определенного вида цены на которые снижаются. Осуществляется в целях уменьшения средневзвешенных издержек всего портфеля активов или запасов товара. Данная стратегия фирмы заключается в периодически повторяющемся процессе приобретения или эмиссии акций конкретного выпуска по мере изменения их курсовой стоимости. Если фирма придерживается данной стратегии, то клиент может рассчитывать на определенные льготы.  [c.698]

Если рассматривается проблемная ситуация на уровне "Руководитель звена отрасли", то здесь примерно одинаково часто приходится сталкиваться с природной неопределенностью или строгим конфликтом с повторяющимися ситуациями. Адекватными здесь будут методы теории игр с природой и решения матричных или биматричных игр в смешанных стратегиях.  [c.236]

Смешанные стратегии. Дальнейшее развитие теории матричных игр основывается на исследовании игры как некоторого повторяющегося процесса. Действительно, вряд ли можно дать содержательные рекомендации по такому вопросу, как следует поступать участникам однократно проводимой игры, не имеющей седловой точки. В случае же ее многократных повторов естественной и плодотворной представляется идея рандомизации выбора стратегий игроками, т. е. внесение в процесс выбора элемента случайности. Действительно, систематическое отклонение, например, игрока I от максиминной стратегии с целью увеличения выигрыша может быть зафиксировано вторым игроком и наказано. В то же время абсолютно хаотичный выбор стратегий не принесет в среднем наилучшего результата.  [c.190]

Здесь мы рассмотрим лишь класс игр, для анализа которых можно использовать (при естественной его модификации) алгоритм обратной индукции. Эти игры можно назвать играми с почти совершенной информацией. Другое название — многоэтапные игры с наблюдаемыми действиями. Такие игры можно разбить на несколько этапов t= 1,. .., Т, каждый из которых представляет собой одну или несколько статических игр. В рамках t-ro этапа игроки одновременно выбирают действия, причем каждый игрок знает всю предысторию, т.е. какие действия выбрали другие игроки на предыдущих этапах (1,. .., t- 1) более того, предыстория игры является общеизвестной. Пример такой игры — повторяющаяся конечное число раз статическая игра. Заметим, что множества стратегий некоторых игроков в этих статических играх могут быть пустыми (как, например, на первом этапе игры, представленной на Рис. 169).  [c.667]

Предположим, что Джек и Джилл знают, что они будут играть в в олигополию каждую неделю. Заключая первоначальное соглашение о поддержании определенного уровня производства, они оговаривают и последствия его нарушения. Стороны могли бы, например, договориться о том, что, как только одна из них нарушит условия, договор разрывается и оба участника соглашения выходят на уровень производства по 40 галлонов. Угроза такого наказания может быть вполне достаточна для поддержания координации производства. Каждая сторона понимает, что нарушение соглашения приведет к повышению прибыли с 1800 до 2000, не всего лишь на неделю. После этого прибыль снизится до 1600 и останется на этом уровне. Коль скоро игроки заинтересованы в долгосрочной прибыли, они выберут стратегию отказа от однократного выигрыша, получаемого при нарушении соглашения. Таким образом, в игре повторяющейся дилеммы узников два игрока вполне способны достичь взаимовыгодного результата.  [c.364]

Повторяющаяся дилемма узников — довольно сложная игра. Чтобы поощрять сотрудничество, игроки должны иметь возможность наказывать друг друга за отход от него. Однако стратегия, описанная ранее для водяного картеля Дже--саи Джилл — отказ от сотрудничества при первом нарушении соглашения, — не отличается гибкостью. В постоянно возобновляющейся игре более предпочтительной оказывается стратегия, позволяющая игрокам приходить к заранее согласованному результату после периода отсутствия координации действий.  [c.365]

Смысл ключевого понятия эволюционной теории игр — эволюционно устойчивой стратегии (ЭУС) — состоит в следующем. Предположим, что индивиды (агенты) повторяющимся образом выбираются случайно из большой популяции, чтобы разыграть симметричную игру двух лиц (то есть игру Г = 1, 2 , А, иг- г = 1, 2 , где А — множество стратегий и первого и второго игрока, причем Ui(z,y) = u(z,y) и и2(ж,у) = u(y,z) для некоторой (непрерывной) функции и), и предположим, что первоначально все индивиды "генетически запрограммированы" играть определенную чистую или смешанную стратегию. Теперь "добавим" некоторую малую долю популяции, которая запрограммирована играть некоторую другую чистую или смешанную стратегию. "Укоренившаяся" стратегия называется эволюционно устойчивой, если для любой такой "мутантной" стратегии, существует такой положительный "барьер вторжения", что если доля популяции индивидов, играющих "мутант-ную" стратегию, падает ниже этого барьера, то "укоренившаяся стратегия дает больший выигрыш, чем "мутантная" стратегия.  [c.178]

Возникает интересный вопрос существуют ли состояния равновесия в повторяющейся игре, которые не соответствуют состояниям равновесия разовой игры Рассмотрим следующую стратегию Игрока 1 в периоде 1 он выбирает Т. В периоде 2 выбирает Мпри условии, что в периоде 1 игроки сыграли (Т, L) в противном случае Игрок 1 выбирает В. Что касается Игрока 2, примем следующую стратегию выберем L в периоде 1. В периоде 2 выберем С при условии, что в периоде 1 игроки выбрали (Т, L) в противном случае выберем R.  [c.69]

При каких значениях дисконтирующих множителей пара стратегий следующего вида будет совершенным в подыграх равновесием в повторяющейся игре Ауманна В первом раунде сотрудничать в остальных раундах поступать так же, как другой игрок в предыдущем раунде 267  [c.694]

В повторяющейся игре G(T) или G(oo,S) история игры до шага t — это "запись" ходов игроков до шага t. В конечно повторяющейся игре G(T) или бесконечно повторяющейся игре G (oo, ) стратегия игрока описывает действие игрока, которые он предпринимает на каждом шаге, для любой возможной истории. (В этом смысле история соответствует информационному множеству каждая история приводит к вполне определенному информационному множеству (одноточечному), а каждому информационному множеству (одноточечному) соответствует вполне определенный путь (история), который приводит именно к этому информационному множеству).  [c.112]

Таким образом, доказано, что в рассмотренной бесконечной повторяющейся игре существует Парето-оптимальноеточки зрения олигополистов) равновесие. Фактически же это равновесие не будет единственным. Можно придумать бесконечно много различных пар стратегий, составляющих совершенное в подыграх равновесие, и среди этих равновесий есть не Парето-оптимальные.  [c.569]

Проанализируем повторяющуюся игру Ауманна. Используя обратную индукцию, рассмотрим последний раунд игры. Заметим, что все, что происходило в предыдущих раундах, влияет только на выигрыши, но не на множества стратегий. Однако влияние на выигрыши сводится только к тому, что ко всем выигрышам данного раунда добавляется одна и та же константа, определяемая предысторией игры. Таким образом, при анализе можно не  [c.689]

В отличие от игры с конечным числом повторений, в бесконечно повторяющейся игре Ауманна возможно возникновение сотрудничества. Рассмотрим стратегии следующего вида  [c.690]

Следует отметить, однако, что рассмотренное равновесие будет не единственным совершенным в подыграх равновесием в бесконечно повторяющейся игре Ауманна. На самом деле в бесконечно повторяющихся играх практически всегда равновесий бесконечно много. В частности, стратегии в которых независимо от предыстории игроки всегда берут 1 доллар себе тоже составляют равновесие.  [c.691]

Несовпадение между поведением, стремящимся к максимизации личной выгоды, и результатами социальной кооперации явилось ключевым фактором, определившим конкретный путь развития теории игр. Так называемая "дилемма заключенного", которая служит основой теории игр, тесно связана с "проблемой безбилетника", предложенной Мансуром Олсоном в 1965 году. Обе дилеммы ведут к безрадостным выводам в отношении проблем сотрудничества и координации между людьми. Однако самые грустные стороны анализа, проведенного Олсоном, и проблем "дилеммы заключенного" отражают статическую природу анализа и то обстоятельство, что речь идет об "одноразовой игре". Иными словами, если "дилемма заключенного" играется только один раз, то доминирующей стратегией для игроков является отказ от сотрудничества, и они тем самым теряют возможность достичь тех результатов, которые повысили бы совокупное благосостояние игроков. Однако хорошо известно, что отказ от сотрудничества не обязательно является доминирующей стратегией, когда ситуация повторяется снова и снова подобно многим проблемам коллективных действий. В итеративной, повторяющейся игре по "дилемме заключенного" нет доминирующей стратегии. В знаменитой ныне дискуссии по этому вопросу Роберт Аксельрод доказал, что в условиях непрерывно повторяющейся игры к успеху ведет стратегия "отвечай тем же самым" — игрок отвечает на действия других такими же действиями. Этот вывод позволил Аксельроду написать знаменитую книгу "Эволюция кооперации" (1984), которая содержит оптимистическую оценку возможностей людей выработать совместные кооперативные решения проблем без вмешательства и принуждения государства  [c.29]

Это так называемая триггерная стратегия (стратегия переключения). Если игроки придерживаются этой стратегии, то в бесконечно повторяющейся игре равновесным исходом будет (Ri, R%) на каждом шаге12.  [c.111]

Мы вначале покажем, что если 8 достаточно близко к 1, то это есть равновесие по Нэшу в бесконечно повторяющейся игре для обоих игроков, придерживающихся этой стратегии. А затем покажем, что это СПРН.  [c.111]

Рассмотрим бесконечно повторяющуюся игру, в которой базовая игра — это рассматриваемая дуополия по Курно, причем у обеих фирм общий коэффициент дисконтирования S. Мы сейчас вычислим значение S, для которых в совершенном "под-игровом" равновесии по Нэшу этой бесконечно повторяющйся игры играется (обеими фирмами) следующая стратегия  [c.114]

Итак, предположим, что небольшая группа мутантов появилась в большой популяции индивидов, каждый из которых запрограммирован играть некоторую одну и ту же "укоренившуюся" стратегию х G А (чистую или смешанную). Предположим, что все мутанты запрограммированы играть некоторую другую (чистую или смешанную) "мутантную" стратегию у G А. Пусть доля мутантов в "пост-входной" популяции есть е G (0,1). Пары индивидов в этой биморфной (представлены две стратегии) популяции выбираются (повторяющимся образом) случайно, чтобы разыгрывать игру, причем все индивиды выбираются равновероятно. Следовательно, если некоторый индивид выбран разыграть игру, то вероятность того, что его оппонент будет играть "мутантную" стратегию у, есть е, а вероятность того, что будет играть "укоренившуюся" стратегию, есть 1 — е. Выигрыш в матче (схватке) в такой биморфной популяции совпадает с выигрышем в матче с индивидом, играющим смешанную стратегию  [c.179]

Смотреть страницы где упоминается термин Стратегии в повторяющихся играх

: [c.187]    [c.56]   
Организация отраслевых рынков (2003) -- [ c.68 , c.69 ]