Семинар Ильи Контаева (Xperience AI).
За последние несколько лет архитектуры на базе Transformer заняли важное место в задачах обработки естественного языка. Однако использование механизма self-attention в задачах компьютерного зрения ограничено из-за квадратичной сложности данной операции.
В семинаре рассмотрены основные идеи и трюки, использованные в Vision Transformer (ViT), которые позволяют решать задачу классификации изображений без использования свёрточных слоёв. Также кратко рассмотрены архитектуры, которые используют ViT в таких задачах как детектирование объектов (Swin Transformer) и генерация изображений (TransGAN).
60 views
19
6
4 weeks ago 00:00:00 4
BILAN GÉOPOLITIQUE DE L’ANNÉE 2024 ET CE QUI NOUS ATTEND POUR 2025 | GPTV LA MATINALE
4 weeks ago 00:01:27 1
Alita 2: Battle Angel (2025) – First Trailer | Rosa Salazar (HD)
1 month ago 00:01:27 1
I put Linkin Park over Transformers One
1 month ago 00:08:44 1
The Future of Cinema: How AI Filmmaking Is Changing Filmmaking Forever!
2 months ago 00:28:30 1
“The Most Unique Home You’ve Ever Seen: Project Blow Your Mind
2 months ago 00:08:10 1
AI Agents Will Create MILLIONAIRES in 2025 – Are You Ready