Met OCR gescande PDF's: hoe u ze doorzoekbaar kunt maken
Je hebt een stapel gescande contracten, een oud boekhoofdstuk dat je hebt gefotografeerd, of een map met afbeeldingen van ontvangstbewijzen. Ze zien eruit als PDF's, maar u kunt ze niet doorzoeken, er geen tekst uit kopiëren of een naam in een zoekvak plakken. Welkom in de wereld van "beeld-PDF's" — en OCR is jouw uitweg.
Wat OCR eigenlijk doet
OCR (Optical Character Recognition) leest elke pagina zoals een mens dat zou doen: het identificeert lettervormen, groepeert ze in woorden en schrijft die woorden als een tekstlaag achter de originele afbeelding. De pagina ziet er nog steeds identiek uit, maar is nu ook doorzoekbaar, kopieerbaar en bewerkbaar.
Nauwkeurigheidsverwachtingen
- Hardgedrukte tekst: 95-99% nauwkeurigheid
- Kranten/oudere boeken: 90-95%
- Telefoonscans van schone documenten: 88-94%
- Handschrift: 50-80%, hangt sterk af van de schrijver
- Wiskundige/scheikundige formules: Beperkt: gespecialiseerde tools werken beter
Talen die we ondersteunen
Onze PDF OCR verwerkt meer dan 50 talen, waaronder Engels, Turks, Duits, Frans, Spaans, Italiaans, Portugees, Russisch, Chinees, Japans, Koreaans, Arabisch en Hindi. U kunt meerdere talen kiezen voor documenten waarin scripts worden gecombineerd.
Tips voor betere OCR-resultaten
- Gebruik de juiste taal. Als u 'Engels' selecteert in een Turks document, daalt de nauwkeurigheid tot 60%. Kies altijd de taal die u scant.
- Scans met een hogere resolutie = betere OCR. 300 DPI is de goede plek. Onder de 200 DPI neemt de nauwkeurigheid snel af.
- Rechte pagina's. Als de scan gedraaid of scheef is, kunt u dit eerst oplossen met PDF roteren.
- Schone originelen. Koffievlekken, vingers in de hoek en donkere schaduwen verwarren OCR. Snijd indien mogelijk de daadwerkelijke pagina bij.
Wat u kunt doen na OCR
Zodra een scan een tekstlaag heeft:
- Zoeken in de PDF (Ctrl+F)
- Kopieer tekst en plak deze in Word, e-mail of notities
- Converteren naar Word met PDF naar Word
- Vertaal de tekstinhoud
- Maak het document toegankelijk voor schermlezers
Privacy
OCR draait op Europese servers. Documenten worden tijdens het transport gecodeerd en na verwerking verwijderd. We bewaren, delen of analyseren uw scans niet.