ओसीआर स्कैन की गई पीडीएफ़: उन्हें खोजने योग्य कैसे बनाएं
आपके पास स्कैन किए गए अनुबंधों का ढेर, आपके द्वारा खींची गई एक पुरानी पुस्तक का अध्याय, या रसीद छवियों का एक फ़ोल्डर है। वे पीडीएफ़ की तरह दिखते हैं, लेकिन आप उन्हें खोज नहीं सकते, उनमें से टेक्स्ट कॉपी नहीं कर सकते, या खोज बॉक्स में कोई नाम पेस्ट नहीं कर सकते। "छवि पीडीएफ" की दुनिया में आपका स्वागत है - और ओसीआर आपका रास्ता है।
ओसीआर वास्तव में क्या करता है
ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) प्रत्येक पृष्ठ को एक व्यक्ति की तरह पढ़ता है: यह अक्षरों के आकार की पहचान करता है, उन्हें शब्दों में समूहित करता है, और उन शब्दों को मूल छवि के पीछे एक टेक्स्ट परत के रूप में लिखता है। पृष्ठ अभी भी दिखता है समान - लेकिन अब यह खोजने योग्य, प्रतिलिपि बनाने योग्य और संपादन योग्य भी है।
सटीकता अपेक्षाएं
- स्पष्ट मुद्रित पाठ: 95-99% सटीकता
- समाचार पत्र/पुरानी किताबें: 90-95%
- स्वच्छ दस्तावेज़ों का फ़ोन स्कैन: 88-94%
- हस्तलेखन: 50-80%, बहुत हद तक लेखक पर निर्भर करता है
- गणित/रसायन विज्ञान सूत्र: सीमित — विशेष उपकरण बेहतर काम करते हैं
जिन भाषाओं का हम समर्थन करते हैं
हमारा पीडीएफ OCR अंग्रेजी, तुर्की, जर्मन, फ्रेंच, स्पेनिश, इतालवी, पुर्तगाली, रूसी, चीनी, जापानी, कोरियाई, अरबी, हिंदी सहित 50+ भाषाओं को संभालता है। आप उन दस्तावेज़ों के लिए एकाधिक भाषाएँ चुन सकते हैं जिनमें स्क्रिप्ट मिश्रित होती हैं।
बेहतर OCR परिणामों के लिए युक्तियाँ
- सही भाषा का उपयोग करें। तुर्की दस्तावेज़ पर "अंग्रेजी" का चयन करने से सटीकता 60% तक कम हो जाती है। हमेशा वह भाषा चुनें जिसे आप स्कैन कर रहे हैं।
- उच्च रिज़ॉल्यूशन स्कैन = बेहतर ओसीआर। 300 डीपीआई सबसे अच्छा स्थान है। 200 डीपीआई से नीचे, सटीकता तेजी से गिरती है।
- सीधे पन्ने। यदि स्कैन घुमाया गया है या तिरछा है, तो पहले इसे पीडीएफ रोटेट से ठीक करें।
- साफ-सुथरी मूल वस्तुएं। कॉफी के दाग, कोने में उंगलियां और काली छायाएं OCR को भ्रमित करती हैं। यदि आप कर सकते हैं तो वास्तविक पृष्ठ को काटें।
ओसीआर के बाद आप क्या कर सकते हैं
एक बार स्कैन में टेक्स्ट परत होती है:
- पीडीएफ के अंदर खोजें (Ctrl+F)
- टेक्स्ट कॉपी करें और वर्ड, ईमेल या नोट्स में पेस्ट करें
- वर्ड में कनवर्ट करें पीडीएफ से वर्ड
- पाठ्य सामग्री का अनुवाद करें
- दस्तावेज़ को स्क्रीन पाठकों के लिए सुलभ बनाएं
गोपनीयता
ओसीआर यूरोपीय सर्वर पर चलता है। दस्तावेज़ों को ट्रांज़िट में एन्क्रिप्ट किया जाता है और प्रसंस्करण के बाद हटा दिया जाता है। हम आपके स्कैन को रखते, साझा या विश्लेषण नहीं करते हैं।