© 2008 А.В. Иринев
Руководитель: А.А. Шалыто
Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Бакалаврская работа
Исходные коды
Презентация
В работе предложен новый подход для построения вероятностных управляющих автоматов, основанный на применении алгоритмов стимулирующего обучения (reinforcement learning). Предложенный подход позволяет решать задачи оптимизации для систем, имеющих определённую стохастическую природу, для которых использование традиционных методов обучения оказывается неэффективным. Данный подход не работает напрямую с вероятностной моделью, а генерирует её на последнем шаге обучения мобильного агента. В работе подробно рассмотрен процесс генерации и последующего сжатия результирующей вероятностной модели.