OCR ein gescanntes PDF – machen Sie es durchsuchbar
Ein gescanntes PDF ist nur ein Stapel von Bildern. Sie können es nicht durchsuchen, Sie können keinen Text daraus kopieren und Screenreader können blinden Benutzern nicht dabei helfen, sich darin zurechtzufinden. OCR – optische Zeichenerkennung – behebt dieses Problem, indem es die Pixel liest und sie wieder in tatsächlichen Text umwandelt.
Wählen Sie die Sprache des Dokuments für höchste Genauigkeit aus – Englisch vs. Türkisch vs. Deutsch verwenden alle unterschiedliche Optimierungen. Das Tool verarbeitet mehrseitige PDFs und stapelt den erkannten Text in derselben Reihenfolge. Sie erhalten entweder eine durchsuchbare PDF-Datei (sieht gleich aus, aber mit einer unsichtbaren Textebene unter dem Bild) oder eine einfache TXT-Datei.
Die Qualität der Eingaben ist wichtig. Ein sauberer 300-DPI-Scan erkennt nahezu perfekt. Ein verschwommenes Telefonfoto eines Ausdrucks weist Fehler auf. Das Tool teilt Ihnen den Konfidenzwert mit, sodass Sie wissen, wie sehr Sie der Ausgabe vertrauen können.