Когда использовать программу OmniPage
В программе Power PDF реализована эффективная встроенная функция распознавания текста, аналогичная распознаванию текста в программе OmniPage.
Вместе с тем у программы оптического распознавания текста (OCR) OmniPage® есть определенные преимущества, поскольку она обеспечивает дополнительные возможности управления распознаванием текста.
Выбор из четырех уровней форматирования вместо двух (см. ниже).
Полный контроль над процессом оптического распознавания текста, включая:
возможность выделения областей на странице вручную;
доступ к многоязычным средствам проверки орфографии и редактирования;
вывод изображения с динамической проверкой для ускорения редактирования;
возможность воспроизведения записанного голоса;
и многое другое.
Сканирование новых страниц в преобразованный документ.
Добавление новых страниц из факсимильных файлов, файлов изображений или с цифровых камер.
Сохранение файлов в других форматах, включая внутренний формат OmniPage для обмена документами с другими пользователями OmniPage.
Для сохранения в OmniPage предлагаются четыре уровня форматирования.
1. Страница с поточным текстом
На страницах сохраняется макет исходных документов. Графические элементы и элементы в рамках размещаются в текстовых блоках. По возможности остальной текст переносится без использования текстовых блоков. В программе Power PDF такой вариант называется «Колонка с поточным текстом». См. раздел Стандартный документ.
2. True Page
На страницах сохраняется макет исходных документов, но все элементы размещаются в текстовых блоках, включая текст в колонках. Программа Power PDF предоставляет возможность такого форматирования. См. раздел Стандартный документ.
3. Форматированный текст
Колонки из текста убираются, но атрибуты текста, графические изображения и таблицы сохраняются.
4. Простой текст
Колонки из текста убираются, а документ преобразуется в простой текст. Графические изображения и таблицы сохраняются, но не на своих исходных местах. Этот вариант удобен для пользователей, которым нужно переформатировать содержимое документа.