OCR сканованого PDF-файлу — зробіть його доступним для пошуку
Відсканований PDF-файл — це лише стос зображень. Ви не можете шукати в ньому, ви не можете скопіювати з нього текст, а програми зчитування екрана не можуть допомогти сліпим користувачам орієнтуватися в ньому. OCR — оптичне розпізнавання символів — виправляє все це, зчитуючи пікселі та перетворюючи їх на справжній текст.
Виберіть мову документа для найкращої точності — англійська чи турецька чи німецька використовують різну оптимізацію. Інструмент обробляє багатосторінкові PDF-файли та складає розпізнаний текст в одному порядку. Ви отримуєте PDF-файл із можливістю пошуку (виглядає так само, але з невидимим шаром тексту під зображенням) або звичайний файл .txt.
Якість вхідних даних має значення. Чисте сканування 300 DPI розпізнає майже ідеально. Розмита фотографія телефону на роздруківці матиме помилки. Інструмент повідомляє вам оцінку надійності, щоб ви знали, наскільки довіряти результатам.