OCR スキャンした PDF: 検索可能にする方法

2026-05-09 PDF OCR

スキャンした契約書の束、写真に撮った古い本の章、または領収書の画像のフォルダーがあります。 PDF のように見えますが、検索したり、テキストをコピーしたり、検索ボックスに名前を貼り付けたりすることはできません。「画像 PDF」の世界へようこそ — OCR がそこから抜け出す手段です。

OCR (光学式文字認識) は、人間が行うのと同じように各ページを読み取ります。文字の形状を識別し、それらを単語にグループ化し、それらの単語を元の画像の背後にテキストレイヤーとして書き込みます。ページは依然として見た目は同じですが、検索、コピー、編集も可能になりました。

当社の PDF OCR は、英語、トルコ語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語、ロシア語、中国語、日本語、韓国語、アラビア語、ヒンディー語を含む 50 以上の言語を処理します。スクリプトが混在するドキュメントでは複数の言語を選択できます。

<オル>

正しい言語を使用してください。 トルコ語のドキュメントで「英語」を選択すると、精度が 60% に低下します。スキャンする言語を常に選択してください。

高解像度のスキャン = 優れた OCR。 300 DPI が最適です。 200 DPI 未満では、精度が急速に低下します。

まっすぐなページ。 スキャンが回転または傾いている場合は、最初に PDF 回転を使用して修正します。

きれいなオリジナル。 コーヒーの汚れ、隅の指、暗い影により OCR が混乱します。可能であれば、実際のページをトリミングしてください。

スキャンにテキストレイヤーが含まれる場合:

OCR はヨーロッパのサーバーで実行されます。文書は転送中に暗号化され、処理後に削除されます。当社はスキャンを保存、共有、分析しません。

このツールを今すぐ試す