ОБРАБОТКА ЗВУЧАЩЕЙ РЕЧИ / PIPELINE SPEECH RECOGNITION / DSС HSE NN / ЛЕКЦИЯ 1
Лекция от представителя Тинькофф Екатерины Чуйковой о обработке звучащей речи, современный способах и архитектурах.
00:00 интро
1:06 вступление и план лекции
2:05 формулировка задачи
2:56 применение распознавания речи
4:43 проблемы
5:57 выравнивание
7:04 токены и их виды
8:10 выявление фичей из звука
12:46 другие способы выявления фичей
13:21 классическое акустической моделирование
13:51 end-to-end моделирование
15:07 пример выхода нейронной сети
16:37 переход от выравнивания к тексту: техники
17:29 минусы greedy decoding на примере
19:54 prefix beam search
22:54 оценивание правдоподобия последовательности слов
23:57 использование языковой модели с beam search
25:32 архитектура STT систем
26:29 метрики качества WER и LER
28:35 данные для обучения
29:28 дополнительные задачи при распознавании речи
31:00 confidence score для переранжирования гипотез
31:51 денормализация
32:52 endpointer, VAD для улучшения качества
35:15 разделение дикторов
36:24 голосовая активация
38:05 context biasing
39:54 команда Тинькофф
10 views
3427
1237
4 years ago 00:40:33 10
ОБРАБОТКА ЗВУЧАЩЕЙ РЕЧИ / PIPELINE SPEECH RECOGNITION / DSС HSE NN / ЛЕКЦИЯ 1