OCR di un PDF scansionato: rendilo ricercabile
Un PDF scansionato è semplicemente una pila di immagini. Non puoi cercarlo, non puoi copiarne il testo e gli screen reader non possono aiutare gli utenti non vedenti a navigarlo. L'OCR (riconoscimento ottico dei caratteri) risolve tutto questo leggendo i pixel e trasformandoli nuovamente in testo vero e proprio.
Scegli la lingua del documento per la massima precisione: inglese, turco e tedesco utilizzano tutti ottimizzazioni diverse. Lo strumento gestisce PDF multipagina e impila il testo riconosciuto nello stesso ordine. Ottieni un PDF ricercabile (sembra uguale, ma con uno strato di testo invisibile sotto l'immagine) o un semplice file .txt.
La qualità dell'input è importante. Una scansione pulita a 300 DPI riconosce quasi perfettamente. Una foto sfocata del telefono di una stampa presenterà errori. Lo strumento ti indica il punteggio di confidenza in modo da sapere quanto fidarti dell'output.