PDF OCR — Metin Çıkar
Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.
Przesyłanie…
Jak wykonać OCR dla PDF
-
1
Prześlij skanowane PDFPrzeciągnij plik do obszaru przesyłania. Wspieramy skany do 100 MB, setek stron.
-
2
Wybierz język dokumentuOkreśl główny język tekstu, aby zwiększyć dokładność. Można wybrać kilka języków.
-
3
Pobierz PDF z rozpoznanym tekstemKliknij «Rozpoznaj» i otrzymaj PDF, w którym tekst można zaznaczać, kopiować i wyszukiwać.
Dla kogo to jest?
PDF OCR jest dla każdego, kto utknął ze skanami, których nie można przeszukiwać ani kopiować — studentów digitalizujących stare podręczniki, prawników wyciągających klauzulę z zeskanowanej umowy oraz księgowych archiwizujących papierowe faktury. Wyobraź sobie, że sfotografowałeś wydrukowaną stronę i teraz potrzebujesz z niej jednego akapitu: uruchom OCR, a będziesz mógł zaznaczyć i skopiować ten tekst prosto do wiadomości e-mail lub do Worda, zamiast przepisywać go ręcznie.
Pomóż nam ulepszyć
Oceń to narzędzie, Twoja opinia jest cenna!
Czym jest OCR dla PDF?
OCR (Optyczne Rozpoznawanie Znaków) zamienia skanowane PDF w edytowalne i przeszukiwalne dokumenty. Obraz z tekstem staje się tekstem, który można kopiować, wyszukiwać i edytować.
Korzystamy z autorskiej technologii OCR udoskonalanej przez lata dla najwyższej możliwej dokładności. Ponad 100 języków, w tym turecki, angielski, niemiecki, hiszpański, arabski, japoński, chiński — Twoje skany stają się prawdziwym tekstem, który można przeszukiwać.
Pod maską OCR skanuje każdą stronę w poszukiwaniu kształtów liter i cyfr, dopasowuje je do wytrenowanych modeli znaków, a wynik zapisuje z powrotem jako ukrytą warstwę tekstu wyrównaną do miejsca, w którym słowa pojawiają się na obrazie. Ponieważ oryginalny obraz strony pozostaje nietknięty, dokument wygląda dokładnie tak samo — różnicę zauważysz dopiero podczas wyszukiwania, zaznaczania lub kopiowania. Im czystsze źródło, tym lepszy wynik: ostre skany w rozdzielczości 300 DPI, proste strony i dobry kontrast dają niemal idealny tekst, natomiast przekrzywione, rozmyte lub słabo oświetlone ujęcia wprowadzają błędy. Wybór właściwego języka dokumentu również pomaga silnikowi rozróżniać podobne do siebie znaki oraz litery z akcentami. Po zakończeniu przeszukiwalny PDF działa w dowolnym czytniku i jest gotowy do archiwizacji, indeksowania lub dalszej edycji.
Dlaczego OCR z PDF7?
50+ języków
Wyszkolone modele do wszystkiego, od angielskiego po starogrecki. Wybierz język, aby uzyskać najlepszą dokładność.
Wysoka dokładność
95-99% dokładności na skanach jakościowych. Wsparcie dla układów wielokolumnowych i tabel.
Zachowanie układu
Tekst rozpoznawany jest na obrazie — strona wygląda tak samo jak była.
Wyszukiwanie i kopiowanie
Po OCR można szukać tekstu w PDF, kopiować i podświetlać. Przydatne do archiwum.
Najczęściej zadawane pytania
Jaka jest dokładność rozpoznawania?
Nasz silnik OCR osiąga dokładność na poziomie 95–99% w przypadku czystych, nowoczesnych skanów (300 DPI, przy dobrym oświetleniu). Stare, wyblakłe lub skany o niskiej rozdzielczości spadają do 80–90%. Aby uzyskać lepsze rezultaty, zeskanuj ponownie lub zrób wyraźniejsze zdjęcie.
Czy działa z pismem ręcznym?
Nasz OCR szkoli się na tekście drukowanym. Kursywne pismo ręczne jest w dużej mierze nieczytelne. Druk blokowy ołówkiem czasami się sprawdza — spróbuj i przekonaj się.
Czy oryginalny wygląd jest zachowany?
Tak, tekst nakłada się na obraz. Strony wyglądają tak samo, ale tekst jest kopiowalny.
Ile trwa OCR?
Około 2-5 sekund na stronę. Dokument 100-stronicowy w 5-10 minut.
Czy OCR zmienia wygląd mojego pliku PDF?
Nie. Oryginalne obrazy zeskanowanych stron pozostają dokładnie takie, jakie są. PDF7 dodaje jedynie niewidoczną warstwę tekstu za obrazem, dzięki czemu plik wygląda identycznie, ale staje się przeszukiwalny i umożliwia zaznaczanie. Czcionki, pieczątki, podpisy i układ pozostają na swoim miejscu.
Czy istnieje limit rozmiaru pliku lub liczby stron?
Możesz przetwarzać dokumenty wielostronicowe za jednym razem; duże zeskanowane pliki PDF o wielkości kilkudziesięciu MB są obsługiwane bez problemu. Strony obrazów o bardzo wysokiej rozdzielczości po prostu przetwarzają się nieco dłużej. Jeśli plik jest wyjątkowo duży, podzielenie go najpierw na mniejsze pliki PDF przyspieszy cały proces.