OCR un PDF numérisé – Rendez-le consultable
Un PDF numérisé n'est qu'une pile d'images. Vous ne pouvez pas y effectuer de recherche, vous ne pouvez pas en copier du texte et les lecteurs d'écran ne peuvent pas aider les utilisateurs aveugles à s'y retrouver. OCR (reconnaissance optique de caractères) corrige tout cela en lisant les pixels et en les reconvertissant en texte réel.
Choisissez la langue du document pour une meilleure précision : l'anglais, le turc et l'allemand utilisent tous une optimisation différente. L'outil gère les PDF de plusieurs pages et empile le texte reconnu dans le même ordre. Vous obtenez soit un PDF consultable (qui a le même aspect, mais avec un calque de texte invisible sous l'image) ou un simple fichier .txt.
La qualité des entrées est importante. Une analyse nette de 300 DPI reconnaît presque parfaitement. Une photo floue d’une impression sur téléphone comportera des erreurs. L'outil vous indique le score de confiance afin que vous sachiez dans quelle mesure vous pouvez faire confiance au résultat.