ओसीआर एक स्कैन की गई पीडीएफ - इसे खोजने योग्य बनाएं
एक स्कैन की गई पीडीएफ सिर्फ छवियों का एक ढेर है। आप इसे खोज नहीं सकते, आप इसमें से टेक्स्ट कॉपी नहीं कर सकते, और स्क्रीन रीडर नेत्रहीन उपयोगकर्ताओं को इसे नेविगेट करने में मदद नहीं कर सकते। ओसीआर - ऑप्टिकल कैरेक्टर रिकग्निशन - पिक्सल को पढ़कर और उन्हें वास्तविक टेक्स्ट में वापस बदलकर यह सब ठीक करता है।
सर्वोत्तम सटीकता के लिए दस्तावेज़ की भाषा चुनें - अंग्रेजी बनाम तुर्की बनाम जर्मन सभी अलग-अलग अनुकूलन का उपयोग करते हैं। टूल बहु-पृष्ठ पीडीएफ़ को संभालता है और मान्यता प्राप्त टेक्स्ट को उसी क्रम में स्टैक करता है। आपको या तो एक खोजने योग्य पीडीएफ (समान दिखने वाला, लेकिन छवि के नीचे एक अदृश्य पाठ परत के साथ) या एक सादा .txt फ़ाइल मिलती है।
इनपुट की गुणवत्ता मायने रखती है। एक साफ 300 डीपीआई स्कैन लगभग पूरी तरह से पहचान करता है। प्रिंटआउट की धुंधली फ़ोन फ़ोटो में त्रुटियाँ होंगी। टूल आपको आत्मविश्वास स्कोर बताता है ताकि आप जान सकें कि आउटपुट पर कितना भरोसा करना है।