Публикации по теме 'openai-gym'


Повышение уровня — Понимание обучения Q
В моей первой серии уроков я почти охватил все основные термины, а также вы, должно быть, получили четкое представление о том, как работает обучение с подкреплением. Вдобавок к этому мы видели разные подходы к обучению с подкреплением, такие как на основе ценностей, на основе политик, на основе моделей. Предполагая, что вы читали мою предыдущую статью , я сразу перейду к важным концепциям RL. Герой темы этой статьи — Q Learning Итак, давайте начнем понимать реализацию Q-обучения...

Вопросы по теме 'openai-gym'

Глубокое обучение с подкреплением с несколькими непрерывными действиями
Ниже приведена высокоуровневая диаграмма того, как должен выглядеть мой агент, чтобы иметь возможность взаимодействовать с созданной мной индивидуальной средой спортзала. Состояния и действия Среда имеет три состояния [s1, s2, s3] и шесть...
93 просмотров