ПОИСК
Это наилучшее средство для поиска информации на сайте
Эволюционно устойчивые стратегии
из "Теория игр для экономистов вводный курс "
Как мы уже отмечали и во введении, и в предыдущем разделе, эволюционная теория игр представляется чрезвычайно привлекательным подходом к обучению. В типичной для эволюционной теории игр модели, есть популяция агентов, выигрыш каждого из которых является функцией не только его поведения, но и того, как ведут себя агенты, с которыми он взаимодействует. В каждый момент времени, поведение в популяции распределено в соответствии с различными стратегиями, или типами поведения. Если популяция конечна, то состояние (популяции) представляет собой описание того, какие агенты какое поведение выбирают. Если популяция бесконечна, то состояние — это описание долей популяции, которые играют каждую стратегию. Если игрок может максимизировать и знает состояние, то он может выбрать лучший ответ. Если он не знает состояния популяции, тогда он должен сделать заключение о состоянии, исходя из информации, которой он обладает. Кроме того, даже зная состояние, игрок может быть не в состоянии вычислить лучший ответ. Вычисление лучшего ответа требует, чтобы игрок знал все доступные стратегии и соответствующие выигрыши. Наблюдаемая история игры становится важной по двум причинам. [c.176]Во-первых, история передает информацию о том, каковы ожидания относительно игры оппонентов. Во-вторых, наблюдаемый успех или неудача выбора различных действий помогает игрокам определить, что может быть хорошей стратегией в будущем. Имитация часто является важной частью обучения успешному поведению будут учиться. До той степени, до которой игроки имитируют успешное поведение и не вычисляют явно лучшие ответы, у игроков нет необходимости различать знания, получаемые от разыгрывания игры, и знания того, как играют оппоненты. Игроки должны только знать, что было успешным, а не почему оно было успешным. [c.176]
Важным моментом является то, что эволюционная динамка ни в каком аспекте не опирается на какие-либо предположения о поведении или знания, отличные от базового принципа дифференцированного отбора — явное успешное поведение должно увеличивает свое представительство в популяции, в то время как неуспешное — нет. [c.176]
Это свойство является необходимым условием для любой осмысленной модели социального обучения. Предположим, что у нас есть модель, в которой поведение сходится к чему-то, что не является равновесием по Нэшу. Поскольку обстановка в конечном счете становится стационарной и есть стратегия (тип поведения), доступная какому-либо агенту, дающая ему больший выигрыш, то в конце концов этот агент отклонится. [c.177]
Основная идея, лежащая в основе этого понятия, состоит в том, что эволюционно устойчивая стратегия (ЭУС) — это стратегия, которая будучи используемой в некоторой популяции не может быть побеждена другой стратегией, поскольку она не может быть улучшена. Так, если популяция использует стратегию х, то мутанты , использующие какую-то другую стратегию у, не могут распространиться в популяции. [c.177]
Смысл ключевого понятия эволюционной теории игр — эволюционно устойчивой стратегии (ЭУС) — состоит в следующем. Предположим, что индивиды (агенты) повторяющимся образом выбираются случайно из большой популяции, чтобы разыграть симметричную игру двух лиц (то есть игру Г = 1, 2 , А, иг- г = 1, 2 , где А — множество стратегий и первого и второго игрока, причем Ui(z,y) = u(z,y) и и2(ж,у) = u(y,z) для некоторой (непрерывной) функции и), и предположим, что первоначально все индивиды генетически запрограммированы играть определенную чистую или смешанную стратегию. Теперь добавим некоторую малую долю популяции, которая запрограммирована играть некоторую другую чистую или смешанную стратегию. Укоренившаяся стратегия называется эволюционно устойчивой, если для любой такой мутантной стратегии, существует такой положительный барьер вторжения , что если доля популяции индивидов, играющих мутант-ную стратегию, падает ниже этого барьера, то укоренившаяся стратегия дает больший выигрыш, чем мутантная стратегия. [c.178]
Такой подход фокусируется на симметричных попарных взаимодействиях в некоторой популяции. В частности, он не сосредотачивается на взаимодействии более, чем двух индивидов в момент времени. Кроме того, критерий эволюционной устойчивости опирается на тесную связь между выигрышами в игре и степени распространенности стратегии в популяции. [c.178]
Какова же роль величины популяции Здесь есть два элемента один механический , а другой — стратегический . Во-первых, чтобы говорить о барьере вторжения (выражаемом в долях популяции) нужно, чтобы такой барьер превосходил 1/п, где п — численность популяции. Во-вторых, популяция должна быть столь велика, чтобы возможный эффект от текущего индивидуального действия на дальнейшие действия остальных был бы пренебрежим. [c.178]
Стратегия х G А эволюционно устойчива, если это неравенство выполнено для любой мутантной стратегии у ф х, при условии, что популяция мутантов достаточно мала. [c.179]
Определение 5.2.1 Стратегия х G А называется эволюционно устойчивой, если для любой стратегии у ф х существует такой ё G (0,1), что неравенство (5.1) выполнено для любого е G 0, . [c.179]
Достаточно просто проверить, что ЭУС оптимальна против себя самой если х не оптимальна против себя самой, то существует некоторая стратегия у, дающая больший выигрыш против х. Следовательно, если доля е такой мутантной стратегии достаточно мала, то, по непрерывности и, она даст больше против смеси w = еу + (1 — е)х, нежели х, а значит х — не ЭУС. [c.180]
Приведенное выше определение можно переформулировать следующим образом. [c.180]
Определение 5.2.1. х G А называется эволюционно устойчивой, если (ж, ж) является равновесием по Нэшу игры Г и u(y,y) u(z,y) для любого наилучшего ответа у на х (у ф х). [c.180]
Пример. Рассмотрим следующую игру, которую можно интерпретировать по-разному. Ее (или ее модификации) иногда называют игрой цыплята , или ястреб-голубь . [c.180]
Одна из интерпретаций цыплят такова. Навстречу друг другу на машинах мчатся храбрецы . Если никто не сворачивает (оба ведут себя как ястребы), то печальный исход приводит, как минимум, к серьезным травмам. Если оба сворачивают (голуби), то, хотя это не столь эффектно, но, по крайней мере, оба живы и здоровы. Наконец, если только один сворачивает, то он — проигравший (но здоров), а другой — победитель, который получает все . [c.180]
Другая интерпретация состоит в следующем. Идет борьба, скажем, за наследство, оцениваемое в 2 единицы. Если никто не хочет уступать (оба ястреба), то борьба связана с серьезными затратами, например, судебными издержками. Если претенденты договариваются (оба голуби), то они делят наследство пополам. Наконец, если один уступает, то второй получает все . [c.180]
В этой игре три равновесия по Нэшу — (л, г), (г, л) и смешанное равновесие, когда я играется с вероятностью 1/3. [c.180]
Разумеется, такая рациональность не отражает осознанное обучение в биологическом смысле речь идет о том, что те, кто лучше приспособился, быстрее воспроизводится. [c.181]
Таким образом, возможно несколько неожиданно, эволюционное разыгрывание этой игры поддерживает равновесие по Нэшу в смешанных стратегиях. [c.181]
Вернуться к основной статье