Обработка текста, скопированного из Нацкорпуса

Обучение поиску по Национальному корпусу русского языка Текст, скопированный из Нацкорпуса, содержит некорректные символы. Как их убрать?
Back to Top