Встроенная функция оптического распознавания текста

Оптическое распознавание текста — это процесс извлечения текста из изображения. Изображение может быть получено в результате сканирования бумажного документа, открытия электронного файла изображения или PDF-файла. В изображениях нет редактируемых текстовых символов. Вместо этого в них много маленьких точек (пикселей), которые в совокупности составляют символы. Так создается изображение текста на странице.

 

От изображения символов ...  

... к редактируемому тексту

рисунок Пикселизированная буква S

рисунок Редактируемая буква S