Публикации по теме 'vit'


Масштабирование трансформеров видения
Современные системы глубокого обучения верят в масштаб . Крупные нейронные сети с миллиардами и даже триллионами параметров работают потрясающе, поэтому свойство нейронной сети масштабироваться очень важно. Были выдающиеся работы по методологии эффективного масштабирования CNN и преобразователей. Трансформатор Vision (ViT) представляет собой полностью трансформирующую архитектуру, которая показала эффективность обучения, сравнимую с современными CNN в классификации изображений. Как..