ПОИСК
Это наилучшее средство для поиска информации на сайте
Оптимальность в антагонистических играх
из "Теория игр для экономистов-кибернетиков "
Если игрок 2 имеет в игре Г = (х, у, Н) только одну стратегию у0 (т.е. У - Jo ), то оптимальной стратегией игрока 1 будет та его стратегия, для которой функция Н(-, УЪ ) х - R достигает на х своего максимума. [c.26]Такое положение дел усложняется лишь незначительно, если игрок 2 имеет более одной стратегии ( у 1), но можно говорить о случайном выборе им своей стратегии, т.е. об известном игроку 1 априорном вероятностном распределении Y на у. [c.26]
Заметим, что случайный выбор стратегии игроком также можно понимать как некоторую его стратегию. Систематическое рассмотрение таких стратегий занимает важное место в теории игр. К этом вопросу мы вернемся в 8. [c.26]
Однако на основе сказанного естественно считать, что оптимальность для игрока 1 состоит, во всяком случае, в некоторой максимизации, и остается только открытым вопрос, что именно следует максимизировать. [c.27]
Говоря формально, это означает, что оптимальной стратегией игрока 1 в случае произвольной игры Г из (1.1) будет та его стратегия, на которой достигается максимум от некоторого функционала /, определенного на семействе всех функций вида //( , у , где j у. [c.27]
Очевидно, функционал / должен сочетать в себе черты экзогенной характеристики задачи, связанной с априорным подходом к ней и универсальной для всего рассматриваемого класса теоретико-игровых задач, и черты ее эндогенной характеристики, вытекающей из ее конкретных условий. Мы рассмотрим два варианта функционала/. [c.27]
как в п. 2.2, множество у конечно у = ji,. . . , J , то функционал / превращается в функцию fn от п переменных fn (Н (х, у i ), . .. [c.27]
Такой выбор функции fn отражает высказанные еще Лапласом представления о целесообразности, состоящие в том, что если мы не знаем, в каких условиях приходится принимать решение (т.е. выбирать стратегию игрока 1 в игре, не зная, какую стратегию выберет игрок 2), то будет разумным ориентироваться на ожидаемый выигрыш в предположении равновероятной реализации каждой из стратегий игрока 2. [c.27]
однако, противоречит соотношениям (2.3) и (2.2). [c.28]
Подобно линейной функции из (2.1), оператор минимизации однороден (степени 1). Кроме того, он симметричен, и эта симметрия, как легко убедиться, уже не приводит к противоречию того типа, который был описан в п. 2.3. [c.28]
Этот максимин называется нижним значением игры Г и обозначается через vr. [c.29]
Минимакс (2.6) можно понимать также как такой выигрыш игрока 1, что получению им большей суммы может воспрепятствовать игрок 2. Естественно считать, что максимин (2.5) не должен превосходить мини-макса (2.6). В следующем параграфе это предположение будет доказано. [c.29]
Вернуться к основной статье