Святослав Шишкин: Построение пайплайна подготовки данных для синтеза речи

Data Fest Online 2021 NLP in Industry track Я расскажу о том, как в команде Тинькофф идет работа над синтезом речи. Вы узнаете, почему каждый датасайнтист участвует в разработке моделей на всех этапах работ, начиная сбором данных через краудсорсинг и заканчивая деплоем моделей в прод. Также я расскажу про плюсы и минусы такого подхода, а также про технологии, которые мы используем. В результате вы убедитесь, что быть фулстеком-датасайнтистом — легко и просто, если автоматизированы CI/CD-пайплайны, настроены адекватные процессы разметки через краудсорсинг и грамотно выбран технологический стек. Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:

1 view

231