PDF های اسکن شده OCR: چگونه آنها را قابل جستجو کنیم
شما مجموعه ای از قراردادهای اسکن شده، یک فصل کتاب قدیمی که از آن عکس گرفته اید، یا یک پوشه از تصاویر رسید دارید. آنها شبیه فایل های PDF هستند، اما نمی توانید آنها را جستجو کنید، متنی را از آنها کپی کنید، یا نامی را در کادر جستجو جایگذاری کنید. به دنیای "فایل های PDF تصویر" خوش آمدید — و OCR راه خروج شماست.
OCR در واقع چه می کند
OCR (تشخیص کاراکتر نوری) هر صفحه را مانند یک شخص می خواند: اشکال حروف را شناسایی می کند، آنها را به کلمات گروه بندی می کند و آن کلمات را به عنوان یک لایه متن در پشت تصویر اصلی می نویسد. صفحه همچنان به نظر می رسد یکسان است — اما اکنون قابل جستجو، کپی و ویرایش نیز می باشد.
انتظارات دقت
- متن چاپ شده واضح: دقت ۹۵–۹۹٪
- روزنامه/کتابهای قدیمیتر: ۹۰–۹۵٪
- اسکن تلفن اسناد تمیز: 88-94٪
- دست خط: 50 تا 80 درصد، به شدت به نویسنده بستگی دارد
- فرمول های ریاضی/شیمی: محدود — ابزارهای تخصصی بهتر کار می کنند
زبان هایی که پشتیبانی می کنیم
PDF OCR ما بیش از 50 زبان از جمله انگلیسی، ترکی، آلمانی، فرانسوی، اسپانیایی، ایتالیایی، پرتغالی، روسی، چینی، ژاپنی، کرهای، عربی، هندی را مدیریت میکند. میتوانید چندین زبان را برای اسنادی که اسکریپتها را ترکیب میکنند انتخاب کنید.
نکاتی برای نتایج بهتر OCR
- از زبان مناسب استفاده کنید. انتخاب "انگلیسی" در یک سند ترکی دقت را به 60٪ کاهش می دهد. همیشه زبانی را که اسکن میکنید انتخاب کنید.
- اسکن با وضوح بالاتر = OCR بهتر. 300 DPI نقطه شیرین است. زیر 200 DPI، دقت به سرعت کاهش می یابد.
- صفحات مستقیم. اگر اسکن چرخان یا کج است، ابتدا آن را با چرخش PDF برطرف کنید.
- اصل را تمیز کنید. لکههای قهوه، انگشتها در گوشه و سایههای تیره OCR را گیج میکنند. اگر می توانید صفحه واقعی را برش دهید.
چه کارهایی می توانید بعد از OCR انجام دهید
هنگامی که اسکن یک لایه متن دارد:
- در PDF (Ctrl+F) جستجو کنید
- متن را کپی کرده و در Word، ایمیل یا یادداشتها جایگذاری کنید
- تبدیل به Word با PDF به Word
- محتوای متن را ترجمه کنید
- سند را برای صفحهخوانها در دسترس قرار دهید
حریم خصوصی
OCR روی سرورهای اروپایی اجرا می شود. اسناد در حین حمل و نقل رمزگذاری شده و پس از پردازش حذف می شوند. ما اسکن های شما را نگه نمی داریم، به اشتراک نمی گذاریم، یا تجزیه و تحلیل نمی کنیم.