Как работать с оптическим распознаванием символов (OCR)

Если вы загрузите файл PDF или отсканированное изображение в проект, Smartcat автоматически извлечёт текст с помощью технологии оптического распознавания символов (OCR) и преобразует его в файл Word (DOCX).

Результат во многом будет зависеть от качества самого изображения. Прежде чем приступить к переводу, убедитесь, что файл правильно обработан и его содержимое распознано без ошибок. Кроме того, если вам нужно перевести документ на несколько языков, сначала лучше будет исправить его форматирование, что значительно сэкономит время в будущем: вам не нужно будет исправлять форматирование для каждого языка в отдельности.

Как проверить и исправить исходный текст и вёрстку

При создании нового проекта или после загрузки файла в текущий отметьте галочкой пункт «Проверить и исправить вёрстку оригинала». Так вы сможете проверить результаты распознавания и внести необходимые исправления перед началом перевода.

Важно! Для документов такого типа мы советуем проверять вёрстку также и после перевода. Ниже представлено более подробное объяснение.

Обратите внимание, что этот пункт вы должны будете отметить для каждого файла в отдельности. Напротив названия файла, для которого вы хотите исправить вёрстку, появится значок малярного валика. Когда вы будете готовы, завершите создание проекта.

preparing.png

Важно! Система не будет применять ресурсы (память переводов и глоссарии) к тем файлам, которые вы хотите исправить, пока вы не проверите в них вёрстку. Текст из таких файлов также не будет включён в расчёт статистики по проекту.

На странице проекта выберите нужный файл из списка и нажмите на кнопку «Вёрстка оригинала».

layout_check.png

Вы перейдёте на отдельную страницу для проверки вёрстки оригинала. Скачайте подготовленный файл из раздела «Версии файла» и убедитесь, что распознавание прошло без ошибок.

not_changes.png

Если всё верно, нажмите на кнопку «Завершить задачу». Если же вы нашли ошибки, сначала внесите исправления, а затем нажмите на кнопку «Загрузить» и выберите исправленный файл. Обратите внимание, что исправленный файл можно загрузить только в формате Word (DOCX).

update.png

Нажмите на кнопку «Завершить задачу». Затем к исправленному документу будут применены ваши ресурсы и выбранные правила предварительного перевода.

Важно! Проверку вёрстки можно назначить любому участнику вашей команды или фрилансеру на маркетплейсе.

Если вы нашли ошибки в распознанном документе после создания проекта, в настройках документа можно включить проверку вёрстки оригинала.

Set_check.png

Нажмите на значок шестерёнки напротив нужного документа и в появившемся диалоговом окне отметьте галочкой пункт «Проверить и исправить вёрстку оригинала».

Add_check.png

Обратите внимание, что в этом случае перевод сегментов не будет сохранён. Сам процесс проверки и исправления будет таким же, как это описано выше.

Как проверить вёрстку перевода

Часто перевод оказывается значительно длиннее или короче оригинала. По этой причине иногда могут возникать определённые недочёты в финальной вёрстке файла. Чтобы их устранить, вы можете добавить соответствующую задачу в рабочий процесс. Для этого перейдите в настройки проекта и добавьте задачу «Финальная вёрстка».

last_check.png

 Важно! Эту задачу можно назначать для файлов всех форматов любому участнику вашей команды или фрилансеру. Эта функция окажется полезной, если вы предлагаете своим клиентам услуги вёрстки, а также если вы хотите искать исполнителей и назначать всю работу прямо в Smartcat.

Когда финальная вёрстка будет завершена, вы сможете скачать результирующий файл с внесёнными в него исправлениями.

Result.png

Понравилось?

0

Похожие статьи:

    Нет похожих статей