OCR ที่สแกน PDF: วิธีทำให้ค้นหาได้
คุณมีกองสัญญาที่สแกน หนังสือบทเก่าที่คุณถ่าย หรือโฟลเดอร์ภาพใบเสร็จรับเงิน ดูเหมือนไฟล์ PDF แต่คุณไม่สามารถค้นหา คัดลอกข้อความจากไฟล์เหล่านั้น หรือวางชื่อลงในช่องค้นหาได้ ยินดีต้อนรับสู่โลกของ "รูปภาพ PDF" — และ OCR คือทางออกของคุณ
จริงๆ แล้ว OCR ทำอะไรได้บ้าง
OCR (การรู้จำอักขระด้วยแสง) อ่านแต่ละหน้าเหมือนที่บุคคลทั่วไปอ่าน โดยจะระบุรูปร่างของตัวอักษร จัดกลุ่มเป็นคำ และเขียนคำเหล่านั้นเป็นเลเยอร์ข้อความด้านหลังรูปภาพต้นฉบับ หน้าเว็บยังคงดูเหมือนกัน — แต่ตอนนี้สามารถค้นหา คัดลอก และแก้ไขได้
ความคาดหวังที่แม่นยำ
- ข้อความที่พิมพ์คมชัด: ความแม่นยำ 95–99%
- หนังสือพิมพ์/หนังสือเก่า: 90–95%
- การสแกนเอกสารที่สะอาดทางโทรศัพท์: 88–94%
- ลายมือ: 50–80% ขึ้นอยู่กับผู้เขียนเป็นอย่างมาก
- สูตรคณิตศาสตร์/เคมี: มีจำกัด — เครื่องมือพิเศษทำงานได้ดีกว่า
ภาษาที่เรารองรับ
PDF OCR ของเรารองรับมากกว่า 50 ภาษา รวมถึงอังกฤษ ตุรกี เยอรมัน ฝรั่งเศส สเปน อิตาลี โปรตุเกส รัสเซีย จีน ญี่ปุ่น เกาหลี อาหรับ และฮินดี คุณสามารถเลือกหลายภาษาสำหรับเอกสารที่มีสคริปต์ผสม
เคล็ดลับเพื่อผลลัพธ์ OCR ที่ดีขึ้น
- ใช้ภาษาที่ถูกต้อง การเลือก "ภาษาอังกฤษ" ในเอกสารภาษาตุรกีจะลดความแม่นยำลงเหลือ 60% เลือกภาษาที่คุณกำลังสแกนเสมอ
- การสแกนที่มีความละเอียดสูงขึ้น = OCR ที่ดีขึ้น 300 DPI คือจุดที่น่าสนใจ ต่ำกว่า 200 DPI ความแม่นยำจะลดลงอย่างรวดเร็ว
- หน้าตรง หากการสแกนหมุนหรือเอียง ให้แก้ไขโดยหมุน PDF ก่อน
- ต้นฉบับที่สะอาด คราบกาแฟ นิ้วที่มุม และเงาดำสร้างความสับสนให้กับ OCR ครอบตัดหน้าจริงหากทำได้
คุณสามารถทำอะไรได้บ้างหลังจาก OCR
เมื่อการสแกนมีเลเยอร์ข้อความ:
- ค้นหาภายใน PDF (Ctrl+F)
- คัดลอกข้อความและวางลงใน Word, อีเมล หรือบันทึกย่อ
- แปลงเป็น Word ด้วย PDF เป็น Word
- แปลเนื้อหาข้อความ
- ทำให้โปรแกรมอ่านหน้าจอสามารถเข้าถึงเอกสารได้
ความเป็นส่วนตัว
OCR ทำงานบนเซิร์ฟเวอร์ยุโรป เอกสารจะถูกเข้ารหัสระหว่างการขนส่งและถูกลบหลังจากการประมวลผล เราไม่เก็บ แบ่งปัน หรือวิเคราะห์การสแกนของคุณ