Обучение с подкреплением становится ключевым компонентом искусственного интеллекта. В основе обучения с подкреплением лежит марковский случайный процесс. Во время процесса агент будет пытаться найти наилучшую стратегию в пространстве действий.

  1. Введение:

Проблема распределения регистров — это проблема NP-Complete, которая направлена ​​на сопоставление виртуального регистра с физическим и обычно решается с использованием эвристической стратегии. Основная причина в том, что эвристический метод упрощается и приближается к решению за относительно фиксированное время. Однако этот метод не исследует пространство поиска наилучшего решения для каждой цели. В последнее время все больше и больше ASIC разрабатываются резко из-за необходимости параллелизма для тяжелых вычислительных задач. Следовательно, для увеличения параллелизма необходимо иметь целевую стратегию распределения регистров.

R-Lens предоставляет интерфейс и вариант реализации для оптимизатора вычислений и повышения параллелизма вычислений за счет использования аппаратных ресурсов. Мы предложили новый метод, который минимизирует количество регистров и сериализует этапы вычислений. Метод обучения с подкреплением пытается избежать препятствий конвейера, устраняя зависимость от данных при обучении на различных целевых машинах. Он собирает данные из среды из среды и изучает различные стратегии распределения. Следовательно, он преобразует вычислительную задачу так, как это подходит для конкретного устройства.

Ссылка на проект — rlens.

В следующей статье будет показано более подробно о реализации.