Никита Мартынов SAGE: мультиязычная коррекция орфографии и пунктуации

Ближайшая конференция I’ML: #imlconf #ml #mlops #IT #conference #jugrugroup Расскажу о методологии для мультиязычной генеративной правки орфографии и пунктуации из нашей статьи с EACL 2024 [].  Практический результат наших исследований — библиотека SAGE [] с открытыми весами наших предобученных трансформерных моделей для исправления орфографии и пунктуации, открытыми параллельными датасетами с ручной разметкой для исправления орфографии на русском языке и двумя алгоритмами аугментации на основе намеренного искажения правописания. Скачать презентацию с сайта —
Back to Top