Публикации по теме 'deep-reinforcement'


[AAMAS 2018] Q-сеть глубокого анализа политик для многоагентных систем
Полный документ AAMAS 2018 Ключевые слова Глубокое обучение с подкреплением, многоагентная система (MAS), Q-сеть глубокого анализа политик (DPIQN) Введение В последнее десятилетие большое внимание уделялось моделированию и использованию поведения других агентов в мультиагентной системе (MAS). Однако в такой системе окружающая среда, воспринимаемая каждым агентом, со временем меняется из-за действий, предпринимаемых другими агентами, вызывая нестационарность в наблюдениях..