Семинар Ильи Контаева (Xperience AI).
За последние несколько лет архитектуры на базе Transformer заняли важное место в задачах обработки естественного языка. Однако использование механизма self-attention в задачах компьютерного зрения ограничено из-за квадратичной сложности данной операции.
В семинаре рассмотрены основные идеи и трюки, использованные в Vision Transformer (ViT), которые позволяют решать задачу классификации изображений без использования свёрточных слоёв. Также кратко рассмотрены архитектуры, которые используют ViT в таких задачах как детектирование объектов (Swin Transformer) и генерация изображений (TransGAN).
60 views
19
6
2 months ago 00:43:27 1
Extraordinaire et Dernier Entretien de Nikola TESLA. Nous Sommes des Dieux et l’avons oublié.
2 months ago 00:09:55 1
TERANET le satellite laser 6G CHOC venu de l’espace ! la Chine applaudit
2 months ago 02:59:05 1
CONVERSATION PROFONDE-EXPÉRIENCE DE MORT IMMINENTE-À QUOI POURRAIT-ELLE RESSEMBLER? VISION DE 40Kpds