PDF OCR — Metin Çıkar
Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.
جارٍ الرفع…
كيفية إجراء OCR لـ PDF
-
1
ارفع PDF الممسوحةاسحب الملف إلى منطقة الرفع. ندعم مسحوحات حتى 100 ميجابايت ومئات الصفحات.
-
2
اختر لغة المستندحدد اللغة الأساسية للنص لزيادة دقة التعرف. يمكن اختيار عدة لغات.
-
3
نزّل PDF بالنص المتعرف عليهاضغط «تعرّف» واحصل على PDF يمكن تحديد النص فيه ونسخه والبحث عنه.
لمن هذه الأداة؟
أداة PDF OCR مخصصة لكل من علق مع عمليات مسح لا يستطيع البحث فيها أو نسخها — الطلاب الذين يرقمنون كتبًا قديمة، والمحامون الذين يستخرجون بندًا من عقد ممسوح، والمحاسبون الذين يؤرشفون فواتير ورقية. تخيّل أنك صوّرت صفحة مطبوعة وتحتاج الآن إلى فقرة واحدة منها: شغّل OCR لتتمكن من تحديد هذا النص ونسخه مباشرة إلى بريد إلكتروني أو Word بدلاً من إعادة كتابته يدويًا.
ساعدنا على التحسن
قيم هذه الأداة، ملاحظاتك قيمة!
ما هو OCR لـ PDF؟
OCR (OCR) يحوّل PDF الممسوحة إلى مستند قابل للتعديل والبحث. الصورة التي تحتوي نصاً تصبح نصاً يمكن نسخه والبحث عنه وتعديله.
نحن نستخدم تقنية OCR (OCR) الخاصة والتي تم تحسينها على مدار سنوات للحصول على أعلى دقة ممكنة. أكثر من 100 لغة بما في ذلك التركية والإنجليزية والألمانية والإسبانية والعربية واليابانية والصينية - تصبح عمليات المسح الخاصة بك نصًا حقيقيًا قابلاً للبحث.
خلف الكواليس، يفحص OCR كل صفحة بحثًا عن أشكال الحروف والأرقام، ويطابقها مع نماذج أحرف مدرَّبة، ثم يكتب النتيجة مجددًا كطبقة نصية مخفية محاذية للمكان الذي تظهر فيه الكلمات داخل الصورة. وبما أن صورة الصفحة الأصلية تبقى دون مساس، يبدو المستند تمامًا كما هو، ولا تلاحظ الفرق إلا عند البحث أو التظليل أو النسخ. وكلما كان المصدر أنظف، كانت النتيجة أفضل: فعمليات المسح الواضحة بدقة 300 DPI، والصفحات المستقيمة، والتباين الجيد تنتج نصًا شبه مثالي، في حين تتسبب الصور المائلة أو الضبابية أو الملتقطة في إضاءة ضعيفة في أخطاء. كما يساعد اختيار لغة المستند الصحيحة المحرك على تمييز الأحرف المتشابهة والحروف ذات العلامات. وبمجرد الانتهاء، يعمل ملف PDF القابل للبحث في أي قارئ ويكون جاهزًا للأرشفة أو الفهرسة أو مزيد من التحرير.
لماذا OCR مع PDF7؟
أكثر من 50 لغة
نماذج مدربة لكل شيء من الإنجليزية إلى اليونانية القديمة. اختر لغتك للحصول على أفضل دقة.
دقة عالية
دقة 95-99% على المسحوحات الواضحة. يدعم التخطيط متعدد الأعمدة والجداول.
حفظ التخطيط
يُتعرف على النص فوق الصورة — يبقى مظهر الصفحة كما هو.
بحث ونسخ
بعد OCR يمكن البحث عن النص داخل PDF ونسخه وتمييزه. مفيد للأرشفة.
الأسئلة الشائعة
ما دقة التعرف؟
يصل محرك OCR (OCR) الخاص بنا إلى دقة تصل إلى 95-99% في عمليات المسح الحديثة النظيفة (300 نقطة في البوصة، مضاءة جيدًا). تنخفض عمليات الفحص القديمة أو الباهتة أو منخفضة الدقة إلى 80-90%. أعد المسح الضوئي أو التقط صورة أوضح للحصول على نتائج أفضل.
هل يعمل مع الكتابة اليدوية؟
يتم تدريب تقنية OCR لدينا على النص المطبوع. الكتابة اليدوية المخطوطة غير قابلة للقراءة إلى حد كبير. أحيانًا تنجح الطباعة بالقلم الرصاص — جربها وانظر.
هل يُحفظ المظهر الأصلي؟
نعم، يُوضع النص فوق الصورة. يبقى مظهر الصفحات كما هو، لكن النص يصبح قابلاً للنسخ.
كم يستغرق OCR؟
حوالي 2-5 ثوانٍ لكل صفحة. مستند 100 صفحة يستغرق 5-10 دقائق.
هل يغيّر OCR شكل ملف PDF الخاص بي؟
لا. تُترك صور الصفحات الممسوحة الأصلية تمامًا كما هي. يضيف PDF7 فقط طبقة نصية غير مرئية خلف الصورة، فيبدو الملف مطابقًا لكنه يصبح قابلاً للبحث والتحديد. تبقى الخطوط والأختام والتوقيعات والتنسيق في أماكنها.
هل يوجد حد لحجم الملف أو عدد الصفحات؟
يمكنك معالجة المستندات متعددة الصفحات دفعة واحدة؛ وتُعالَج ملفات PDF الممسوحة الكبيرة التي تبلغ عشرات الـ MB دون مشكلة. أما صفحات الصور عالية الدقة جدًا فتستغرق وقتًا أطول قليلاً في المعالجة فحسب. وإذا كان الملف كبيرًا بشكل غير معتاد، فإن تقسيمه إلى ملفات PDF أصغر أولاً يسرّع الأمر.