OCR een gescande PDF – maak deze doorzoekbaar
Een gescande PDF is slechts een stapel afbeeldingen. Je kunt er niet in zoeken, je kunt er geen tekst uit kopiëren en schermlezers kunnen blinde gebruikers niet helpen er doorheen te navigeren. OCR (optische tekenherkenning) lost dit allemaal op door de pixels te lezen en ze weer om te zetten in daadwerkelijke tekst.
Kies de taal van het document voor de beste nauwkeurigheid: Engels versus Turks versus Duits gebruiken allemaal een andere optimalisatie. De tool verwerkt PDF's van meerdere pagina's en stapelt de herkende tekst in dezelfde volgorde. U krijgt een doorzoekbare PDF (ziet er hetzelfde uit, maar met een onzichtbare tekstlaag onder de afbeelding) of een gewoon .txt-bestand.
De kwaliteit van de input is belangrijk. Een schone 300 DPI-scan herkent vrijwel perfect. Een wazige telefoonfoto van een afdruk bevat fouten. De tool vertelt u de betrouwbaarheidsscore, zodat u weet in hoeverre u de uitvoer kunt vertrouwen.