Информатика 7 класс. §17 Системы перевода и распознавания текста
Сегодня, когда мы можем получить доступ к знаниям со всего мира, возникает потребность в быстром автоматизированном переводе. Эту задачу выполняют программы-переводчики.
Переводчики знают особенности построения фраз переводимых языков, грамматические формы, и могут выдать вполне грамотную фразу на вашем родном языке.
Главная трудность автоматического перевода - многозначность слов. Что бы помочь правильно подобрать значение – нужно определить из какой области текст.
Другая проблема – использование нарицательных значений, и фразеологических оборотов.
Для этого программы-переводчики применяют шаблоны фраз. Но всё равно получаются ошибки.
Идея передать перевод «коллективному разуму», которую применял Google не принесла успеха. Переводчик Google предлагал пользователям улучшить перевод и запоминал предложенные варианты. Но нашлось слишком много шутников, которые стали давать фривольные варианты перевода. Известен мем с переводом в Чехии надписи «Берегите голову» как «Не вмажьтесь головой» с матерным словом.
Продвинутые программы перевода позволяют переводчику в удобном интерфейсе проходить последовательно по каждому слову и выводят для каждого слова набор его значений. Пользователю остаётся только щёлкать мышкой на нужном значении.
Есть также полуавтоматические программы – в них вообще может не быть словаря – они запоминают как вы перевели текст, и в следующий раз встречая такое же сочетание слов подставляют ваш вариант.
Для тех, кто знает иностранный язык, но не знает некоторых слов, есть программы – словари. Вы просто подводите мышку к незнакомому слову и программа показывает варианты перевода.
Вообще, надо сказать, что появление бесплатных переводчиков подкосило рынок программ перевода. Большинству людей достаточно корявого перевода, а кто хочет качественную работу – обращается к профессионалам. Количество покупателей упало, и сделало разработку нерентабельной.
* Распознавание текста
Лидером в России является российская программа FineReader. Кроме распознавания она умеет распознавать шрифт, и даже сохраняет форматирование!
Алгоритм распознавания сначала выделяет объекты похожие на фразы, затем разбивает её на отдельные буквы, и на слова.
Затем либо сравнивает каждую букву с эталоном – если тест хорошо напечатан, либо может применять «фонтанное преобразование» метод – при которым анализируются опорные точки схождения элементов, изменения направления, и т.п. «Фонтанное преобразование» может распознать плохо пропечатанный текст, и даже разобрать рукописный текст – для него не важно совпадает ли буква с шаблоном, а важны «опорные точки», которые даже при нетвёрдом почерке обычно у всех одинаковы.
4 views
142
37
1 month ago 00:58:43 20
Теория вероятностей на ЕГЭ по математике
1 month ago 00:11:00 2
ЕГЭ информатика 2025 задание 19,20,21 задача 4829 Поляков репетитор по информатике Игорь Лоч
1 month ago 00:04:06 2
ЕГЭ Информатика 2025 задание 12 задача 4779 Поляков репетитор по информатике Игорь Лоч
1 month ago 00:05:17 1
ЕГЭ 2025 Информатика задание 8 задача 6129 без рекурсии Поляков Репетитор по информатике Лоч Игорь
1 month ago 00:09:40 22
ЕГЭ информатика 2025 задание №5 задача 7667 Поляков Репетитор по информатике Игорь Лоч
1 month ago 00:08:51 9
ЕГЭ информатика 2025 Задание №5 задача 7650 Поляков Репетитор по информатике Игорь Лоч
1 month ago 00:10:51 1
ЕГЭ информатика 2025 Задание №5 задача №7 Поляков и задача №141 Поляков
1 month ago 00:06:47 1
ЕГЭ информатика 2025 репетитор по информатике Игорь Лоч задание №3 задача 7616 Поляков
1 month ago 00:09:18 28
ЕГЭ информатика 2025 задание №3 задача 7617 Поляков Реепетитор по информатике Игорь Лоч
1 month ago 00:11:03 1
7 класс. Информатика. Современные сервисы интернет-коммуникаций и правила их использования
1 month ago 01:21:13 1
Алгоритмы на Python 3. Лекция №21 (весной 7-я)
1 month ago 01:20:31 1
Алгоритмы на Python 3. Лекция №7
1 month ago 00:29:19 1
Разбор заданий школьного этапа ВсОШ 2023 года по информатике, 7-8 классы, 1 группа регионов
1 month ago 00:07:33 11
ЕГЭ Информатика 2025 задание 17 Задача с сайта Полякова 7685 репетитор по информатике Игорь Лоч
1 month ago 00:04:59 1
ЕГЭ информатика 2025 задание 11, задача 5702 с сайта Полякова Репетитор по информатике Лоч Игорь
1 month ago 00:22:04 5
Что такое Data Science (наука о данных) простыми словами
1 month ago 01:59:48 5
Разбор авторского варианта №1 с КЕГЭ | Информатика 2025 | Сергей Горбачев
1 month ago 00:05:00 1
Информация и ее свойства | Информатика 7 класс #2 | Инфоурок
1 month ago 02:02:44 1
Разбор варианта уровня ЕГЭ #2 - Информатика 2024
1 month ago 01:53:56 1
Задание #22 с 0 до 100 за 1 веб | ЕГЭ по информатике 2024 | Артем Flash