OCR em um PDF digitalizado – torne-o pesquisável
Um PDF digitalizado é apenas uma pilha de imagens. Você não pode pesquisá-lo, não pode copiar texto dele e os leitores de tela não podem ajudar usuários cegos a navegar nele. OCR (reconhecimento óptico de caracteres) corrige tudo isso lendo os pixels e transformando-os novamente em texto real.
Escolha o idioma do documento para obter melhor precisão. Inglês, turco e alemão usam otimizações diferentes. A ferramenta lida com PDFs de várias páginas e empilha o texto reconhecido na mesma ordem. Você obtém um PDF pesquisável (tem a mesma aparência, mas com uma camada de texto invisível abaixo da imagem) ou um arquivo .txt simples.
A qualidade da entrada é importante. Uma digitalização limpa de 300 DPI reconhece quase perfeitamente. Uma foto desfocada de uma impressão no telefone apresentará erros. A ferramenta informa a pontuação de confiança para que você saiba o quanto confiar no resultado.