УНИВЕРСИТЕТ ИТМО | ||||
Главная / Дипломы / Генерация вероятностных автоматов методами стимулирующего обучения
(версия для печати)
Генерация вероятностных автоматов методами стимулирующего обучения
© 2008 А.В. Иринев Санкт-Петербургский государственный университет информационных технологий, механики и оптики
Бакалаврская работа
Аннотация
В работе предложен новый подход для построения вероятностных управляющих автоматов, основанный на применении алгоритмов стимулирующего обучения (reinforcement learning). Предложенный подход позволяет решать задачи оптимизации для систем, имеющих определённую стохастическую природу, для которых использование традиционных методов обучения оказывается неэффективным. Данный подход не работает напрямую с вероятностной моделью, а генерирует её на последнем шаге обучения мобильного агента. В работе подробно рассмотрен процесс генерации и последующего сжатия результирующей вероятностной модели.
| ||||
|