Теперь проверим, образуют ли эти стратегии равновесие в повторяющейся игре. Если период 1 закончился результатом (Т, L), то в периоде 2 в соответствии с намеченными выше стратегиями игроки должны выбрать (М, Q. Поскольку эти действия образуют равновесие Нэша в разовой игре, то в интересах игроков выполнить их еще раз во втором периоде двухпериодной повторяющейся игры. Другими словами, ни один игрок не в состоянии увеличить свой выигрыш, выбрав иной вариант. Аналогично, если [c.69]
Поскольку игроки могут реагировать на предпринятые другими игроками действия, равновесные результаты в повторяющихся играх могут отличаться от равновесия в соответствующих разовых играх. [c.70]
Повторяющиеся игры являются способом моделирования повторяющегося взаимодействия между игроками. Поскольку игроки могут реагировать на предпринятые другими игроками действия, равновесные результаты в повторяющихся играх могут отличаться от равновесия в соответствующих разовых играх. [c.71]
Если процентная ставка равна 10 %, образуется ли с установлением цены, определенной в пункте (Ь), равновесие Нэша в повторяющейся игре с участием обеих фирм А если процентная ставка 110 % Какова наивысшая процентная ставка, при которой цена, максимизирующая совокупную прибыль фирм, отличается устойчивостью [c.151]
На рынке действуют два продавца с идентичными производственными функциями. Они заключают соглашение о разделе рынка. Если обе фирмы будут следовать соглашению, их прибыль будет составлять по 80 млн. руб. ежегодно. Если обе фирмы нарушат соглашение, они получает прибыль по 30 млн. руб. Если одна фирма нарушит соглашение, а вторая нет, то нарушитель получает 150 млн. руб. прибыли, а соблюдавшая соглашение сторона -10 млн. руб. Какие стратегии фирм формируют Парето-рав новее ие Что будет служить равновесием по Нэшу в неповторяющейся игре в повторяющейся игре Почему для ответа на последний вопрос важно знать значение дисконтирующего множителя вероятности повторных продаж [c.161]
Заметим, что если траектория системы, т. е. последовательность ситуаций (z1, z2, z3,. ..), сходится к некоторому равновесному состоянию z, то это будет равновесие по Нэшу. Обобщением описанной схемы выбора рациональных стратегий в повторяющихся играх является так называемая гипотеза индикаторного поведения. В случае индикаторного поведения элемент использует стратегию 5 + (4.18.5) как индикатор , показывающий направление изменения предыдущей стратегии zf, и делает шаг в этом направлении. В формальной записи [c.187]
Почти-совершенная" информация динамические игры с симметричной информацией. Правдоподобные угрозы, невозвратимые издержки "игра враждебные соседи". Минимальные наказания, "око за око". Повторяемая "дилемма заключенных" братание войск в 1ой Мировой войне, неприменение газа во 2-ой Мировой войне. Множественность равновесий и фокальные точки. "Народная теорема" о реализуемости "всех" исходов в бесконечной повторяемой игре с угрозами и малым дисконтом. [c.94]
Чтобы показать, что это есть равновесие по Нэшу в бесконечно повторяющейся игре, предположим, что i -ый игрок использует триггерную стратегию, и покажем, что если S достаточно близко к 1, то для j-ого игрока лучшим ответом будет тоже применять такую стратегию. Так как игрок i будет играть Li всегда, как только на каком-то шаге исход отличается от ( Ri, R2), то лучшим ответом j-ого будет тоже играть LJ всегда после нарушения ( Ri, R2)- Т.е. осталось определить лучший ответ j -ого игрока на 1-ом шаге и на всех шагах таких, что все предыдущие были ( Ri, R2) Игра LJ даст 5 на этом шаге, но переключит на "некооперативное поведение" игрока i (а значит и j ) навсегда. Следовательно, на любом будущем шаге выигрыш будет 1 так как 1+ + 2+ + = 1/(1 — ), то приведенная стоимость последовательности выигрышей есть 5 + + 2 + --- = 5 + . [c.111]
Возникает интересный вопрос существуют ли состояния равновесия в повторяющейся игре, которые не соответствуют состояниям равновесия разовой игры Рассмотрим следующую стратегию Игрока 1 в периоде 1 он выбирает Т. В периоде 2 выбирает Мпри условии, что в периоде 1 игроки сыграли (Т, L) в противном случае Игрок 1 выбирает В. Что касается Игрока 2, примем следующую стратегию выберем L в периоде 1. В периоде 2 выберем С при условии, что в периоде 1 игроки выбрали (Т, L) в противном случае выберем R. [c.69]
При каких значениях дисконтирующих множителей пара стратегий следующего вида будет совершенным в подыграх равновесием в повторяющейся игре Ауманна В первом раунде сотрудничать в остальных раундах поступать так же, как другой игрок в предыдущем раунде 267 [c.694]
В более реалистичной модели должна быть предусмотрена возможность периодического изменения цен. В частности, допустим, что время поделено на ряд периодов t= 1, 2,. .. и что в каждом периоде фирмы одновременно устанавливают цены. Другими словами, предположим, что фирмы играют в игру Бертрана в каждом из бесконечной серии периодов. На жаргоне теории игр — фирмы играют в повторяющуюся игру. Каково состояние равновесия в такой динамической игре Очевидно, что одно возможное состояние равновесия образуется, если фирмы в каждом из периодов ифают на достижение равновесия Нэша—Бертрана, игнорируя события, происходившие в предыдущих периодах. Действительно, если Фирма 1 знает, что в каждом периоде Фирма 2 будет приравнивать цену к предельным издержкам независимо от действий Фирмы 1, то ее оптимальным ответом будет также приравнивание цены к предельным издержкам. [c.133]
Далее рассмотрим игры предпоследнего раунда, которые становятся играми последнего раунда в редуцированной игре. Свертывание последнего раунда добавляет к выигрышам предпоследнего раунда одну и ту же константу (в нашем случае это 1 для обоих игроков). Предыстория игры тоже влияет только тем, что добавляет константу к выигрышам. Таким образом, опять с точностью до константы получаем исходную игру. Продолжая редуцировать игру, мы на всех раундах получим одно и то же решение, совпадающее с равновесием исходной игры. Таким образом, равновесная траектория будет представлять собой п раз повторенное равновесие обычной игры Ауманна. Догадка о возникновении сотрудничества в повторяющейся игре в данном случае не подтверждается. [c.690]
В этой игре уже 3 р.Н. — ( 1 2), (М1 М2), ( R1 R2). Эти три р.Н. соответствуют СПРН в первоначальной повторяющейся игре. Обозначим ((w,x)(y,z)) — исходы в повторяющейся игре — (w, x) — на 1-ом шаге, (у, z) — на 2-ом. Равновесие ( 1 2) соответствует "совершенному под-игровому" исходу ((Ll7 L2), (Ll7 L2)) в повторяющейся игре. Аналогично р.Н. ( R1 R2) соответствует "совершенному под-игровому" исходу (( / , R2), (Li, L2)) в повторяющейся игре. Эти два исхода просто "наследуют" р.Н. базовой игры. Но третий исход — качественно другой (М1 М2) — соответствует "совершенному под-игровому" (СП) исходу [c.107]
Имеет место следующее уточнение если в базовой игре G есть несколько равновесий по Нэшу, то может существовать СПРН в повторяющейся игре G(T) такое, что для любого t < Т исход шага t не является равновесием по Нэшу. В бесконечно повторяющихся играх справедлив более сильный результат даже если в базовой игре G есть единственное равновесие по Нэшу, то может существовать СПРН бесконечно повторяющейся игры, в которой никакой "no-шаговый" исход не будет равновесием по Нэшу. [c.110]
Такой принцип выбора будем называть принципом условного максимина, а соответствующее решение — Н-ре-шением. Заметим, что после того как выбор произведен, может оказаться, что z (i) е П,- (2г) для одного или нескольких элементов. В условиях повторяющейся игры разумно предположить, что в случае (г) б Пг (2г) элемент пересмотрит свои прежние представления о множестве Пг (2г) таким образом, чтобы его новые предположения И, (ii) не противоречили реальному выбору, т. е. 2j (i) (ЕЕ Пг (z ). Если же предположения всех элементов оправдались, т. е. zl (i) GE Пг (z ), i Е I, то можно ожидать и сохранения предположений Пг (гг) (элементы убеждаются в истинности своих представлений о поведении других элементов). В последнем случае совокупность множеств П = П (zi) будем называть обоснованной, а соответствующую ситуацию — П-равновесшм. В формальной записи П-равновесие определяется как ситуация z такая, что [c.185]
Таким образом, доказано, что в рассмотренной бесконечной повторяющейся игре существует Парето-оптимальное (с точки зрения олигополистов) равновесие. Фактически же это равновесие не будет единственным. Можно придумать бесконечно много различных пар стратегий, составляющих совершенное в подыграх равновесие, и среди этих равновесий есть не Парето-оптимальные. [c.569]
Как нетрудно заметить, повторяющиеся игры являются разновидностью игр с почти совершенной информацией, поэтому совершенное в подыграх равновесие в них можно находить обратной индукцией. [c.689]
Следует отметить, однако, что рассмотренное равновесие будет не единственным совершенным в подыграх равновесием в бесконечно повторяющейся игре Ауманна. На самом деле в бесконечно повторяющихся играх практически всегда равновесий бесконечно много. В частности, стратегии в которых независимо от предыстории игроки всегда берут 1 доллар себе тоже составляют равновесие. [c.691]
В нашем варианте дилеммы заключенного мы покажем, что "кооперация" (Ri, RZ) на каждом шаге может быть СПРН бесконечно повторяющейся игры (хотя единственный равновесный исход в базовой игре — это (Li L )). А именно, если игроки кооперируются сегодня, то они кооперируются и завтра и т. д., а в противном случае они играют "плохое" равновесие. [c.110]
Мы вначале покажем, что если 8 достаточно близко к 1, то это есть равновесие по Нэшу в бесконечно повторяющейся игре для обоих игроков, придерживающихся этой стратегии. А затем покажем, что это СПРН. [c.111]
Рассмотрим бесконечно повторяющуюся игру, в которой базовая игра — это рассматриваемая дуополия по Курно, причем у обеих фирм общий коэффициент дисконтирования S. Мы сейчас вычислим значение S, для которых в совершенном "под-игровом" равновесии по Нэшу этой бесконечно повторяющйся игры играется (обеими фирмами) следующая стратегия [c.114]
Существует теорема (в англоязычной литературе она известна под названием Folk Theorem, что на русский можно перевести как Народная теорема ), утверждающая, что в бесконечно повторяющейся конечной статической игре с полной информацией любой разумный вектор выигрышей может возникнуть в некотором совершенном в подыграх равновесии, если дисконтирующие множители достаточно близки к единице. Под разумным вектором выигрышей мы понимаем такой вектор выигрышей, который является выпуклой комбинацией выигрышей исходной игры (с точностью до множителей 1 - 5г, необходимых для того, чтобы сделать выигрыши сопоставимыми), и кроме того, в нем каждый элемент должен быть не меньше некоторой пороговой величины. В разных вариантах теоремы пороговая величина разная это либо выигрыш в каком-либо равновесии Нэша исходной [c.691]
Второй важнейший элемент для нашего понимания человеческого поведения — это расшифровка информации, поступающей из внешнего мира Этот вопрос играет незначительную роль, или вообще не играет роли, в стандартных экономических исследованиях, хотя Лукас (1986) признает выводы из моделей рационального ожидания не имеют смысла без обучения со стороны игроков, а также вне условий устойчивого равновесия и конкуренции (эти условия указаны Уинтером), что делает выбор и альтернативы хорошо понятными для игроков. На первый взгляд посыпки об устойчивом равновесии и знании альтернатив весьма привлекательны, потому что наша жизнь состоит из привычных действий, в процессе которых проблема выбора возникает по отношению к обычным, повторяющимся и достаточно ясным вопросам, так что 90 процентов наших ежедневных действий не требует особых размышлений. Но на самом деле именно существование "встроенного" набора институгов позволяет нам избежать обдумывания проблем и столкновения с ситуациями, когда приходится делать выбор. Мы легко принимаем решения, поскольку наше взаимодействие с окружающим миром институционализировано таким образом, чтобы снизить неопределенность. Но как только мы переходим от выбора, касающегося личных и устойчиво повторяющихся вопросов, к выбору, выходящему за рамки личного опыта и относящегося к неповторяющемуся взаимодействию с миром, неопределенность результатов возрастает. Чем сложнее и уникальнее стоящие перед нами вопросы, тем выше неопределенность. У нас просто нет теорий, которые позволили бы надежно предсказать последствия наших решений, а информация, которую мы получаем в таких ситуациях, часто не позволяет обновить и тем самым улучшить наши модели поведения. Об этом очень хорошо написал Герберт Саймон [c.40]