ПОИСК
Это наилучшее средство для поиска информации на сайте
Обучение и эволюция
из "Теория игр для экономистов вводный курс "
Исследование ограниченно рационального процесса приспособления к равновесию по Нэшу стало полем активных исследований последних лет. Появляющуюся литературу можно весьма условно разделить на две категории обучение и эволюцию. В литературе по обучению обычно предполагается, что игроки могут вычислить наилучший ответ и проверить, как игроки совершенствуют свои представления о стратегиях своих оппонентов в фиксированном матче . Напротив, эволюционный подход не предполагает обязательную способность оптимизировать и анализирует эволюцию поведения через пробы и ошибки и естественный отбор в популяции игроков. [c.170]Мы можем погрузить игру двух (или п) лиц в такую обстановку , уточняя механизм, в соответствии с которым пары игроков из популяции выбираются для разыгрывания этой игры. Здесь есть целый ряд моделей. [c.172]
Модель с одной парой. В каждом периоде одна пара игроков выбирается случайным образом для разыгрывания игры. В конце раунда, ходы игроков становятся известными всем. Здесь, если популяция велика, то скорее всего, игроки, играющие сегодня, долгое время будут оставаться неактивными. Даже для терпеливых игроков не будет целесообразным жертвовать текущим выигрышем, чтобы повлиять на будущую игру оппонентов, если размер популяции достаточно велик в сравнении с дисконтирующим множителем. [c.172]
В симметричной игре, в дополнение к крайним случаям однородных и неоднородных популяций можно также рассматривать смесь этих двух случаев, когда каждый игрок имеет какие-то шансы встретиться в матче с оппонентом из другой популяции и какие-то шансы - с оппонентом из той же популяции. [c.173]
Мы остановимся сейчас (весьма кратко) на одном специфическом процессе динамического приспособления - так называемом фиктивном разыгрывании, полностью основанном на идее обучения, а затем перейдем к модели, основанной на идее эволюции. [c.173]
В процессе фиктивного разыгрывания агенты ведут себя так, как будто они считают, что они сталкиваются со стационарным, но неизвестным, распределением на множестве стратегий агентов. [c.173]
Ключевой вопрос, возникающий здесь, состоит в том, сходится ли такой процесс. [c.174]
Состояние процесса фиктивного разыгрывания есть вектор оценок игроков, а не стратегии, играемые в период t, поскольку их хватает для определения будущей эволюции системы. Тем не менее, несколько пренебрегая формальностями терминологии, будем говорить, что набор стратегий является устойчивым состоянием, если он играется в каждом периоде, начиная с некоторое конечного момента времени Т. [c.174]
Равновесие по Нэшу называется строгим, если для каждого игрока г, ss- является единственным лучшим ответом на s z-. Заметим, что строгое равновесие может быть только равновесием в чистых стратегиях, т.к. если смешанная стратегия является лучшим ответом, то таковой же является и любая чистая из носителя смешанной стратегии. [c.174]
Перейдем теперь от моделей, базирующихся на обучении к моделям, связанным с идеей эволюции. [c.175]
Основная идея эволюционного подхода состоит в том, что агенты могут не оптимизировать сознательно, но вести себя так, как если бы они были рациональны, поскольку (экономическая) конкуренция отберет оптимизирующих агентов. [c.175]
Вернуться к основной статье