Потоковое распознавание речи в Марусе / Владимир Гулин (Machine Intelligence VK)
Конференция VK JT (6 марта 2024, «ГЭС-2»), трек Machine Intelligence.
Владимир Гулин, директор по технологиям искусственного интеллекта, Machine Intelligence VK.
Руководил разработкой Поиска Mail․ru, командой поиска и рекомендаций в Юле, Pandao, Delivery Club и командой рекомендаций в Пульсе Mail․ru. Помогал улучшать рекомендации VK Музыки и VK Видео. Совместно с командой Анатолия Орлова внедрил поисковую технологию в AliExpress.
Сейчас руководит разработкой поисковых систем для всей компании VK и разработкой голосового помощника Маруся. Отвечает за развитие Core ML-технологий в VK (NLP, CV, Voice). Выпускник ШАД, кандидат технических наук.
«В докладе расскажу, как устроено распознавание речи в Марусе. Подробно обсудим:
• архитектуру системы потокового распознавания речи;
• детали обучения и инференса в продакшене моделей потокового распознавания;
• а также отвечу на вопрос „Зачем Марусе три различных системы распознавания речи?“».
18 views
123
23
7 months ago 00:42:00 407
Потоковое распознавание речи в Марусе / Владимир Гулин (Machine Intelligence VK)
7 months ago 00:01:32 1
Компания Hippocratic AI совместно с NVIDIA создают первый в отрасли LLM специально для здравоохранен
11 months ago 00:21:20 1
Собираем своими руками сервер за 200$ который тянет 350 потоков
11 months ago 00:35:57 1
ПЛАТОШКИН: О ПРИГОВОРЕ/вероятности покушений/Северном потоке/ВЫБОРАХ/фильме “Народ БАМа“ Пивоварова
1 year ago 03:43:59 2
5 поток. Workshop №2 “Нейронные сети в моей публикации“. День второй
1 year ago 00:37:29 48
Школа «Аутентификация кошельков Money Storage и SberKassa, защита кабинета: CashFlow, ПотокCash и Телеграм Канала.
1 year ago 00:24:03 1
Яндекс Станция Макс Распаковка И обзор
1 year ago 00:04:45 22
АнтиСон. Обзор системы контроля усталости водителя AVS525CPR (датчик усталости водителя).
1 year ago 03:23:45 5
5 поток. Workshop №1 “Нейронные сети в моей публикации“. День первый
1 year ago 00:08:50 1
Распознавание речи в платформе 1С
1 year ago 04:05:35 1
4 поток. Workshop №2 “Нейронные сети в моей публикации“. День третий.
2 years ago 01:27:18 709
Между нами девочками.. Ответила на ваши вопросы
2 years ago 00:17:28 26
Архив загруженных в 1С сканированных документов в “Робот-загрузчик и архив документов“
2 years ago 00:35:29 27
Работа с загруженными документами в 1С Управляемые формы на примере Бухгалтерия предприятия 3.0 (БП3.0)
2 years ago 00:14:24 3
Загрузка 7 документов на 13 сканах в 1С:Бухгалтерию предприятия 3.0 бесплатные OCR
2 years ago 00:45:33 13
Установка программы “Робот-загрузчик и архив документов“
2 years ago 00:07:51 11
Краткая демонстрация загрузки сканов документов и работы в 1С обычные формы УТ10.3
2 years ago 00:09:49 1
Влияние вранья на наши энергетические тела и потоки НЕНАШИХ мыслей в голове 🙃🙃🙃🙃
2 years ago 00:10:42 243
Самые важные технологии с 2010 по 2020. Чем запомнится наше время?
3 years ago 00:19:29 100
Подключение и настройка 4G камеры на CamHipro BOAVISION
3 years ago 00:06:36 14
Потоковая обработка данных в MATLAB
3 years ago 01:30:50 1
18. Мультимедиа – Александр Завьялов, Алексей Гусев
3 years ago 00:03:16 5
4. Аудиокурсы Langme по методу сторителлинг: распознавание речи в потоке
3 years ago 00:00:00 10
opencv fastapi webrtc | распознание объектов в потоковом видео