PDF yang Dipindai OCR: Cara Membuatnya Dapat Dicari
Anda memiliki setumpuk kontrak yang dipindai, bab buku lama yang Anda foto, atau folder gambar tanda terima. Tampilannya seperti PDF, tetapi Anda tidak dapat mencarinya, menyalin teks darinya, atau menempelkan nama ke dalam kotak pencarian. Selamat datang di dunia "PDF gambar" — dan OCR adalah jalan keluarnya.
Apa yang sebenarnya dilakukan OCR
OCR (Pengenalan Karakter Optik) membaca setiap halaman seperti yang dilakukan seseorang: ia mengidentifikasi bentuk huruf, mengelompokkannya menjadi kata-kata, dan menulis kata-kata tersebut sebagai lapisan teks di belakang gambar asli. Laman tersebut masih terlihat sama — namun kini juga dapat ditelusuri, disalin, dan diedit.
Ekspektasi akurasi
- Teks cetakan yang tajam: akurasi 95–99%
- Koran/buku lama: 90–95%
- Pemindaian dokumen bersih melalui telepon: 88–94%
- Tulisan tangan: 50–80%, sangat bergantung pada penulisnya
- Rumus matematika/kimia: Terbatas — alat khusus bekerja lebih baik
Bahasa yang kami dukung
PDF OCR kami menangani 50+ bahasa termasuk Inggris, Turki, Jerman, Prancis, Spanyol, Italia, Portugis, Rusia, China, Jepang, Korea, Arab, Hindi. Anda dapat memilih beberapa bahasa untuk dokumen yang menggabungkan skrip.
Tips untuk hasil OCR yang lebih baik
- Gunakan bahasa yang tepat. Memilih "Bahasa Inggris" pada dokumen Turki menurunkan akurasi hingga 60%. Selalu pilih bahasa yang Anda pindai.
- Pemindaian dengan resolusi lebih tinggi = OCR lebih baik. 300 DPI adalah pilihan terbaiknya. Di bawah 200 DPI, akurasi turun dengan cepat.
- Halaman lurus. Jika pindaian diputar atau miring, perbaiki dengan putar PDF terlebih dahulu.
- Bersihkan dokumen asli. Noda kopi, jari di sudut, dan bayangan gelap membingungkan OCR. Pangkas halaman sebenarnya jika Anda bisa.
Apa yang dapat Anda lakukan setelah OCR
Setelah pemindaian memiliki lapisan teks:
- Cari di dalam PDF (Ctrl+F)
- Salin teks dan tempel ke Word, email, atau catatan
- Konversi ke Word dengan PDF ke Word
- Terjemahkan konten teks
- Jadikan dokumen dapat diakses oleh pembaca layar
Privasi
OCR berjalan di server Eropa. Dokumen dienkripsi saat transit dan dihapus setelah diproses. Kami tidak menyimpan, membagikan, atau menganalisis pindaian Anda.