Публикации по теме 'rainbow'


Введение в глубокое обучение с подкреплением
Глубокое обучение с подкреплением — это результат сочетания двух хорошо известных подходов к машинному обучению: Глубокое обучение и Обучение с подкреплением . Его главная цель — создать единого агента, способного справиться с любой задачей человеческого уровня, но добиться на ней сверхчеловеческих результатов. Известным ИИ, реализующим эту технику, является AlphaGo , который в марте 2016 года впервые в истории победил игрока в го с 9 данами Ли Седоля со счетом 4:1, играя против него..