Как мы уже отмечали и во введении, и в предыдущем разделе, эволюционная теория игр представляется чрезвычайно привлекательным подходом к обучению. В типичной для эволюционной теории игр модели, есть популяция агентов, выигрыш каждого из которых является функцией не только его поведения, но и того, как ведут себя агенты, с которыми он взаимодействует. В каждый момент времени, поведение в популяции распределено в соответствии с различными стратегиями, или типами поведения. Если популяция конечна, то состояние (популяции) представляет собой описание того, какие агенты какое поведение выбирают. Если популяция бесконечна, то состояние — это описание долей популяции, которые играют каждую стратегию. Если игрок может максимизировать и знает состояние, то он может выбрать лучший ответ. Если он не знает состояния популяции, тогда он должен сделать заключение о состоянии, исходя из информации, которой он обладает. Кроме того, даже зная состояние, игрок может быть не в состоянии вычислить лучший ответ. Вычисление лучшего ответа требует, чтобы игрок знал все доступные стратегии и соответствующие выигрыши. Наблюдаемая история игры становится важной по двум причинам.