Параметры преобразования документов PDF с возможностью поиска

Это диалоговое окно отображается в указанных ниже ситуациях.

  • В диалоговом окне Профили PDF Create установите флажок С возможностью поиска и нажмите кнопку Параметры.
  • Нажмите Преобразовать > Другие > PDF с возможностью поиска, затем выберите Параметры в диалоговом окне Преобразование страниц.
  • Проверьте параметры распознавания текста в разделе Файл > Параметры > Документ > Документ PDF с возможностью поиска.

Эти параметры следует использовать для создания PDF-файлов с возможностью поиска из файлов изображений или PDF-файлов, содержащих только изображения, поиск в которых невозможен. Список поддерживаемых типов файлов см. в разделе Create Assistant.

 

Язык распознаваемого текста

Система распознавания текста извлекает текст из изображений, чтобы обеспечить возможность поиска в нем. Выберите язык, который используется в исходном документе.

 

Нераспознанные символы

Нераспознанные символы представляются в виде специального символа дефекта (по умолчанию это тильда: «~»). Например, если при оптическом распознавании не удалось распознать букву «з» в слове «распознать» и в качестве символа дефекта используется символ ~, в распознанном документе будет написано «распо~нать».

Символ дефекта можно задать в поле «Нераспознанные символы». По возможности используйте символ, не встречающийся в документах.

 

Сохранить исходные изображения

Если установить этот флажок, исходное изображение будет сохранено после преобразования.

 

Автоориентация страницы

Если установить этот флажок, ориентация страницы (альбомная или портретная) будет выбираться автоматически.

 

Обработать страницы

Укажите, какие страницы нужно обрабатывать при преобразовании PDF-документа в формат PDF с возможностью поиска.

  • Страницы, содержащие только рисунки По умолчанию Power PDF обрабатывает только страницы с графическим (растровым) содержимым, не имеющие текстового слоя.
  • Все страницы Если выбран этот вариант, обрабатываются все страницы независимо от их содержимого.
    • Использовать систему распознавания текста при обработке документов Этот флажок предписывает обрабатывать документы только с помощью системы распознавания текста. Внутри приложения все страницы будут преобразованы в растровые изображения, а затем обработаны системой распознавания текста. При этом отбрасываются все невизуальные и нестандартные элементы (например, скрытые объекты и знаки с нестандартными кодами). Это может помочь, если стандартная процедура преобразования в PDF с возможностью поиска не работает.
    • Распознавать нестандартные кодировки текста Установите этот флажок для обработки страниц, содержащих текст с нестандартными шрифтами или кодировками.

Автоматически проверять результат после распознавания

 

(Доступно только в Power PDF.)

Установите этот флажок для интерактивной проверки орфографии в обработанном документе. Чтобы добавить или создать собственные словари, нажмите кнопку Пользовательские словари.

 

Автоматически искать страницы только с изображениями (требуется перезапуск)

 

(Доступно только в Power PDF.)

Если установлен этот флажок, программа Power PDF проверяет каждый PDF-документ при его открытии, и если в документе есть страницы, содержащие только изображения, она предлагает преобразовать его в формат PDF с возможностью поиска. Проверка иногда занимает много времени, поэтому этот флажок по умолчанию снят.

 

Выводить сообщения на панели уведомлений

(Этот параметр доступен только в Power PDF и включается только при выборе вышеуказанного флажка.)

Выберите Выводить сообщения на панели уведомлений, чтобы программа Power PDF выводила информацию о страницах, содержащих только изображения, на панели уведомлений под лентой. Нажмите Сделать доступным для поиска, чтобы открыть диалоговое окно «Автоматическое определение» и выбрать настройки распознавания, которые будут применяться к таким страницам.

Снимите флажок Выводить сообщения на панели уведомлений, чтобы программа Power PDF без дополнительного уведомления сразу же открывала диалоговое окно «Автоматическое определение» при обнаружении страниц, содержащих только изображения.

 

Примечание

Если входной файл является текстовым или содержит доступный текстовый слой, обычный PDF-документ с возможностью поиска создается без оптического распознавания. В таких случаях параметры «Язык распознаваемого текста» и «Нераспознанные символы» не используются.