Потоковое распознавание речи в Марусе / Владимир Гулин (Machine Intelligence VK)

Конференция VK JT (6 марта 2024, «ГЭС-2»), трек Machine Intelligence. Владимир Гулин, директор по технологиям искусственного интеллекта, Machine Intelligence VK. Руководил разработкой Поиска Mail․ru, командой поиска и рекомендаций в Юле, Pandao, Delivery Club и командой рекомендаций в Пульсе Mail․ru. Помогал улучшать рекомендации VK Музыки и VK Видео. Совместно с командой Анатолия Орлова внедрил поисковую технологию в AliExpress. Сейчас руководит разработкой поисковых систем для всей компании VK и разработкой голосового помощника Маруся. Отвечает за развитие Core ML-технологий в VK (NLP, CV, Voice). Выпускник ШАД, кандидат технических наук. «В докладе расскажу, как устроено распознавание речи в Марусе. Подробно обсудим: • архитектуру системы потокового распознавания речи; • детали обучения и инференса в продакшене моделей потокового распознавания; • а также отвечу на вопрос „Зачем Марусе три различных системы распознавания речи?“».
Back to Top