Публикации по теме 'openai-gym'
Повышение уровня — Понимание обучения Q
В моей первой серии уроков я почти охватил все основные термины, а также вы, должно быть, получили четкое представление о том, как работает обучение с подкреплением. Вдобавок к этому мы видели разные подходы к обучению с подкреплением, такие как на основе ценностей, на основе политик, на основе моделей. Предполагая, что вы читали мою предыдущую статью , я сразу перейду к важным концепциям RL.
Герой темы этой статьи — Q Learning
Итак, давайте начнем понимать реализацию Q-обучения...
Вопросы по теме 'openai-gym'
Глубокое обучение с подкреплением с несколькими непрерывными действиями
Ниже приведена высокоуровневая диаграмма того, как должен выглядеть мой агент, чтобы иметь возможность взаимодействовать с созданной мной индивидуальной средой спортзала.
Состояния и действия
Среда имеет три состояния [s1, s2, s3] и шесть...
93 просмотров
schedule
19.03.2024