PDF OCR — Metin Çıkar

Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.

veya sürükleyip bırakın
1 PDF hazırlanıyor…
pdf7.org
1 dosya

Yükleniyor…

0%
PDF hazır
Dosyanız hazır. İndirmek için butona basın.
PDF’i indir
Dosyalarınız sunucularımızda saklanmaz, üçüncü kişilerle paylaşılmaz.
Bu araç işine yaradıysa paylaş — başkasının da işini görür
Filigran yok Hızlı işlem Güvenli — dosya saklanmaz Ücretsiz, kayıt yok

Taranmış PDF nasıl OCR edilir

  1. 1
    Taranmış PDF'inizi yükleyin.
    Taranmış sayfalar içeren bir PDF bırakın. Modern tarayıcıların çoğu PDF olarak kaydeder; kameralar JPG olarak kaydeder (onlar için Image to Text kullanın).
  2. 2
    Dilinizi seçin.
    Belgenin ana dilini seçin. Doğru dili seçmek doğruluğu büyük ölçüde artırır. PDF'iniz dilleri karıştırıyorsa birden fazla seçebilirsiniz.
  3. 3
    Aranabilir PDF'i indirin.
    Her sayfanın artık görünmez metin katmanı olan yeni bir PDF iner. Herhangi bir PDF okuyucuda açın, Ctrl+F ile arayın, metin kopyalayın, hatta Word'e yapıştırın.

Kimler için?

PDF OCR, arama yapamadığı veya kopyalayamadığı taramalarla uğraşan herkes içindir — eski kitapları dijitalleştiren öğrenciler, taranmış bir sözleşmeden madde çeken avukatlar ve kâğıt faturaları arşivleyen muhasebeciler. Diyelim ki basılı bir sayfanın fotoğrafını çektiniz ve içinden bir paragrafa ihtiyacınız var: OCR çalıştırın, o metni elle yeniden yazmak yerine doğrudan seçip e-postaya veya Word'e kopyalayın.

Geliştirmemize Yardımcı Olun

Bu aracı puanlayın, geri bildiriminiz değerli!

PDF OCR Nedir?

OCR (Optik Karakter Tanıma), taranan PDF'leri düzenlenebilir ve aranabilir belgelere dönüştüren bir teknolojidir. Metin içeren görselleri kopyalanabilen, aranabilen ve düzenlenebilen metinsel verilere dönüştürün.

Mümkün olan en yüksek doğruluk için yıllar içinde geliştirilen tescilli OCR teknolojisini kullanıyoruz. Türkçe, İngilizce, Almanca, İspanyolca, Arapça, Japonca, Çince dahil 100'den fazla dil — taramalarınız gerçek aranabilir metin haline gelir.

Arka planda OCR, her sayfadaki harf ve rakam şekillerini tarar, bunları eğitilmiş karakter modelleriyle eşleştirir ve sonucu, kelimelerin görseldeki konumuna hizalanmış gizli bir metin katmanı olarak geri yazar. Orijinal sayfa görseli olduğu gibi korunduğu için belge tıpatıp aynı görünür; farkı yalnızca arama yaparken, metni seçerken veya kopyalarken anlarsınız. Kaynak ne kadar temizse sonuç o kadar iyidir: net 300 DPI taramalar, düz sayfalar ve iyi kontrast neredeyse kusursuz metin verir; eğik, bulanık veya az ışıkta çekilmiş görseller ise hatalara yol açar. Belgenin doğru dilini seçmek de motorun birbirine benzeyen karakterleri ve aksanlı harfleri ayırt etmesine yardımcı olur. İşlem bittiğinde aranabilir PDF her okuyucuda çalışır ve arşivleme, indeksleme veya düzenleme için hazırdır.

Neden PDF7 ile OCR yapmalısınız?

100+ dil

İngilizceden Eski Yunancaya kadar her şey için eğitimli modeller. En iyi doğruluk için dilinizi seçin.

Düzen korunur

Orijinal sayfa görselleri kalır; sadece üstüne görünmez metin katmanı ekleriz. PDF değişmemiş görünür ama artık aranabilir.

Abonelik yok

Adobe OCR için ayda 20 dolar alır. Biz ücretsiz veriyoruz, kayıt gerekmez.

Dosyalar gizli kalır

Bellekte işlenir, indirme sonrası silinir. Taramalarınızı asla okumayız veya üzerinde eğitim yapmayız.

Sıkça sorulan sorular

OCR ne kadar doğru?

OCR motorumuz, temiz modern taramalarda (300 DPI, iyi aydınlatılmış) %95-99 doğruluğa ulaşır. Eski, soluk veya düşük çözünürlüklü taramalar %80-90'a düşer. Daha iyi sonuçlar için yeniden tarayın veya daha net bir fotoğraf çekin.

OCR el yazısında çalışır mı?

OCR'miz basılı metin üzerinde eğitilmiştir. Bitişik el yazısı büyük ölçüde okunamaz durumdadır. Kurşun kalemle blok baskı bazen işe yarar; deneyin ve görün.

Zaten metni olan bir PDF'i OCR edebilir miyim?

Yapabilirsiniz ama gereksiz — metin zaten orada. Sadece metin katmanı tespit edilmeyen sayfaları OCR ederiz.

Ne kadar sürer?

Temiz bir taramada sayfa başına yaklaşık 1-2 saniye. 100 sayfalık bir kitap yaklaşık 2-3 dakika sürer. Büyük görseller daha uzun sürer.

OCR, PDF'imin görünümünü değiştirir mi?

Hayır. Orijinal taranmış sayfa görselleri olduğu gibi bırakılır. PDF7 yalnızca görüntünün arkasına görünmez bir metin katmanı ekler; böylece dosya aynı görünür ama aranabilir ve seçilebilir hale gelir. Yazı tipleri, kaşeler, imzalar ve düzen aynen kalır.

Dosya boyutu veya sayfa sınırı var mı?

Çok sayfalı belgeleri tek seferde işleyebilirsiniz; onlarca MB'lik büyük taranmış PDF'ler sorunsuz işlenir. Çok yüksek çözünürlüklü görsel sayfalar yalnızca biraz daha uzun sürer. Dosya alışılmadık derecede büyükse, önce daha küçük PDF'lere bölmek işlemi hızlandırır.

Bu araç işine yaradıysa paylaş

Başkası da ücretsiz kullansın — bir saniye sürüyor.

Deneyiminizi iyileştirmek için çerezler kullanıyoruz. Gizlilik Politikası

PDF7'yi cihazına ekle: iPhone/iPad'de Paylaş'a, sonra 'Ana Ekrana Ekle'ye dokun. Masaüstünde adres çubuğundaki yükleme simgesine tıkla.