Кафедра «Технологии программирования»: Дипломы: Разработка системы, моделирующей поведение агента в стохастической игре с неполной информацией, на примере игры "Покер Техасский Холдем"

Разработка системы, моделирующей поведение агента в стохастической игре с неполной информацией, на примере игры "Покер Техасский Холдем"

Санкт-Петербургский государственный университет информационных технологий, механики и оптики

Аннотация

В работе предлагается новый подход к моделированию поведения игрока в стохастической игре с неполной информацией, основанный на использовании метрики состояний. Разработан алгоритм для построения модели игрока и применен к игре "Покер Техасский Холдем", адаптирован алгоритм построения стратегии, эксплуатирующей ошибки в игре оппонента, к использованию предложенной модели. Для построения модели и стратегии применена техника уменьшения размерности игры.

Эффективность изложенного подхода демонстрируется на примере игры против известных в области исследований построения искусственного интеллекта для игры покер агентов. Результаты работы показывают, что примененный подход позволил значительно сократить объем информации необходимый для построения модели, использование которой приводит к результатам близким к лучшим, полученным ранее другими исследователями.