PDF OCR — Metin Çıkar
Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.
Uploaden…
Hoe OCR uitvoeren op een PDF
-
1
Upload gescande PDFSleep het bestand naar het uploadgebied. We ondersteunen scans tot 100 MB en honderden pagina's.
-
2
Selecteer documenttaalGeef de hoofdtaal van de tekst op om de herkenningsnauwkeurigheid te verhogen. Meerdere talen mogelijk.
-
3
Download PDF met herkende tekstKlik op «Herkennen» en ontvang een PDF waarin je tekst kunt selecteren, kopiëren en doorzoeken.
Voor wie is het?
PDF OCR is voor iedereen die vastzit met scans die niet doorzoekbaar of kopieerbaar zijn — studenten die oude studieboeken digitaliseren, advocaten die een clausule uit een gescand contract halen en boekhouders die papieren facturen archiveren. Stel je voor dat je een gedrukte pagina hebt gefotografeerd en nu één alinea nodig hebt: voer OCR uit en je kunt die tekst rechtstreeks selecteren en kopiëren naar een e-mail of Word in plaats van hem met de hand over te typen.
Help ons verbeteren
Beoordeel deze tool, uw feedback is waardevol!
Wat is OCR voor PDF?
OCR (Optical Character Recognition) zet gescande PDF's om in bewerkbare en doorzoekbare documenten. Een afbeelding met tekst wordt tekst die je kunt kopiëren, doorzoeken en bewerken.
We gebruiken eigen OCR-technologie die in de loop der jaren is verfijnd voor de hoogst mogelijke nauwkeurigheid. Meer dan 100 talen, waaronder Turks, Engels, Duits, Spaans, Arabisch, Japans en Chinees: uw scans worden echte doorzoekbare tekst.
Achter de schermen scant OCR elke pagina op de vormen van letters en cijfers, vergelijkt deze met getrainde tekenmodellen en schrijft het resultaat terug als een verborgen tekstlaag die wordt uitgelijnd op de plek waar de woorden in de afbeelding staan. Omdat de oorspronkelijke pagina-afbeelding ongemoeid blijft, ziet het document er precies hetzelfde uit — je merkt het verschil pas wanneer je zoekt, markeert of kopieert. Hoe schoner de bron, hoe beter het resultaat: scherpe scans van 300 DPI, rechte pagina's en goed contrast leveren vrijwel perfecte tekst op, terwijl scheve, wazige of slecht belichte opnamen fouten veroorzaken. Het selecteren van de juiste documenttaal helpt de engine ook om op elkaar lijkende tekens en letters met accenten te onderscheiden. Eenmaal klaar werkt de doorzoekbare PDF in elke lezer en is hij gereed om te archiveren, te indexeren of verder te bewerken.
Waarom OCR met PDF7?
50+ talen
Getrainde modellen voor alles, van Engels tot Oudgrieks. Kies uw taal voor de beste nauwkeurigheid.
Hoge nauwkeurigheid
95-99% nauwkeurigheid op kwaliteitsscans. Ondersteunt meerkolommige lay-outs en tabellen.
Lay-out behouden
Tekst wordt over de afbeelding herkend — de pagina ziet er hetzelfde uit als voorheen.
Zoeken en kopiëren
Na OCR kun je tekst in de PDF zoeken, kopiëren en markeren. Handig voor archiefbeheer.
Veelgestelde vragen
Hoe nauwkeurig is de herkenning?
Onze OCR-engine bereikt een nauwkeurigheid van 95-99% op schone moderne scans (300 DPI, goed verlicht). Oude, vervaagde scans of scans met een lage resolutie dalen tot 80-90%. Scan opnieuw of maak een duidelijkere foto voor betere resultaten.
Werkt het met handgeschreven tekst?
Onze OCR is getraind op gedrukte tekst. Cursief handschrift is grotendeels onleesbaar. Blokafdrukken met potlood werken soms – probeer het en kijk.
Blijft het origineel bewaard?
Ja, tekst wordt over de afbeelding gelegd. Pagina's zien er hetzelfde uit, maar tekst is kopieerbaar.
Hoe lang duurt OCR?
Ongeveer 2-5 seconden per pagina. Een document van 100 pagina's wordt in 5-10 minuten verwerkt.
Verandert OCR hoe mijn PDF eruitziet?
Nee. De oorspronkelijke gescande pagina-afbeeldingen blijven precies zoals ze zijn. PDF7 voegt alleen een onzichtbare tekstlaag toe achter de afbeelding, zodat het bestand er identiek uitziet maar doorzoekbaar en selecteerbaar wordt. Lettertypen, stempels, handtekeningen en de opmaak blijven allemaal op hun plaats.
Is er een limiet voor de bestandsgrootte of het aantal pagina's?
Je kunt documenten met meerdere pagina's in één keer verwerken; grote gescande PDF's van enkele tientallen MB worden prima afgehandeld. Pagina's met afbeeldingen in zeer hoge resolutie duren simpelweg iets langer om te verwerken. Is een bestand ongewoon groot, dan versnel je het proces door het eerst in kleinere PDF's te splitsen.