© 2010, Е.Д. Долгих
Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Полный текст работы
Презентация
В работе предлагается новый подход к моделированию поведения игрока в стохастической игре с неполной информацией, основанный на использовании метрики состояний. Разработан алгоритм для построения модели игрока и применен к игре "Покер Техасский Холдем", адаптирован алгоритм построения стратегии, эксплуатирующей ошибки в игре оппонента, к использованию предложенной модели. Для построения модели и стратегии применена техника уменьшения размерности игры.
Эффективность изложенного подхода демонстрируется на примере игры против известных в области исследований построения искусственного интеллекта для игры покер агентов. Результаты работы показывают, что примененный подход позволил значительно сократить объем информации необходимый для построения модели, использование которой приводит к результатам близким к лучшим, полученным ранее другими исследователями.