Обзор архитектуры Detection Transformer (DETR)

DETR — одна из самых популярных архитектур для детекции на основе трансформера. DETR позволяет избавиться от сложного постпроцессинга, довольно прост в использовании и отлично показывает себя на датасете COCO, занимая 4 место в лидерборде. В этом видео мы расскажем вам, как устроена данная архитектура. Спикер: Михаил Лиз — CV-инженер в компании 2gis, куратор курса по повышению квалификации в Computer Vision Наш телеграм: 2iFq-56o0RlhNjAy — в нем мы напоминаем теорию, разбираем статьи и делимся советами по обучению нейросетей Полезные ссылки: Оригинальная статья DETR: Официальный репозиторий с кодом: Оригинальная статья про трансформер: Разбор с картинками метрики Generalized Intersection over Union (GIoU): Разбор Венгерского алгоритма на Хабре: Разбор позиционного кодирования в трансформерах:
Back to Top