OCR スキャンした PDF: 検索可能にする方法
2026-05-09
PDF OCR
スキャンした契約書の束、写真に撮った古い本の章、または領収書の画像のフォルダーがあります。 PDF のように見えますが、検索したり、テキストをコピーしたり、検索ボックスに名前を貼り付けたりすることはできません。 「画像 PDF」の世界へようこそ — OCR がそこから抜け出す手段です。
OCR が実際に行うこと
OCR (光学式文字認識) は、人間が行うのと同じように各ページを読み取ります。文字の形状を識別し、それらを単語にグループ化し、それらの単語を元の画像の背後にテキスト レイヤーとして書き込みます。ページは依然として見た目は同じですが、検索、コピー、編集も可能になりました。
期待される精度
- 鮮明な印刷テキスト: 95 ~ 99% の精度
- 新聞/古本: 90~95%
- クリーンな文書の電話スキャン: 88 ~ 94%
- 手書き: 50 ~ 80%、書き手によって大きく異なります
- 数学/化学の公式: 限定的 - 専用ツールの方が適切に機能します
サポートされている言語
当社の PDF OCR は、英語、トルコ語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語、ロシア語、中国語、日本語、韓国語、アラビア語、ヒンディー語を含む 50 以上の言語を処理します。スクリプトが混在するドキュメントでは複数の言語を選択できます。
OCR 結果を向上させるためのヒント
<オル>OCR 後にできること
スキャンにテキスト レイヤーが含まれる場合:
- PDF 内を検索 (Ctrl+F)
- テキストをコピーして Word、メール、メモに貼り付ける
- PDF to Word を使用して Word に変換
- テキストの内容を翻訳する
- スクリーン リーダーがドキュメントにアクセスできるようにする
プライバシー
OCR はヨーロッパのサーバーで実行されます。文書は転送中に暗号化され、処理後に削除されます。当社はスキャンを保存、共有、分析しません。