OCR เป็น PDF ที่สแกน — ทำให้สามารถค้นหาได้
ไฟล์ PDF ที่สแกนเป็นเพียงกองรูปภาพ คุณไม่สามารถค้นหาได้ คัดลอกข้อความออกไปไม่ได้ และโปรแกรมอ่านหน้าจอไม่สามารถช่วยให้ผู้ใช้ที่ตาบอดนำทางได้ OCR — การรู้จำอักขระด้วยแสง — แก้ไขทั้งหมดโดยการอ่านพิกเซลและเปลี่ยนกลับเป็นข้อความจริง
เลือกภาษาของเอกสารเพื่อความถูกต้องแม่นยำที่สุด — อังกฤษกับตุรกีกับเยอรมันต่างก็ใช้การปรับให้เหมาะสมที่แตกต่างกัน เครื่องมือนี้จัดการ PDF หลายหน้าและซ้อนข้อความที่รู้จักในลำดับเดียวกัน คุณจะได้รับไฟล์ PDF ที่สามารถค้นหาได้ (หน้าตาเหมือนกัน แต่มีชั้นข้อความที่มองไม่เห็นอยู่ใต้ภาพ) หรือไฟล์ .txt ธรรมดา
คุณภาพของอินพุตมีความสำคัญ การสแกน 300 DPI ที่สะอาดตาสามารถจดจำได้เกือบสมบูรณ์แบบ ภาพถ่ายที่พิมพ์ออกมาในโทรศัพท์ไม่ชัดจะมีข้อผิดพลาด เครื่องมือจะบอกคะแนนความเชื่อมั่นเพื่อให้คุณรู้ว่าควรเชื่อถือผลลัพธ์ได้มากเพียงใด