OCR zeskanowanego pliku PDF — umożliwienie jego przeszukiwania
Zeskanowany plik PDF to po prostu stos obrazów. Nie można go przeszukiwać, nie można skopiować z niego tekstu, a czytniki ekranu nie mogą pomóc niewidomym użytkownikom w poruszaniu się po nim. OCR — optyczne rozpoznawanie znaków — naprawia to wszystko, odczytując piksele i zamieniając je z powrotem w rzeczywisty tekst.
Wybierz język dokumentu, aby uzyskać najlepszą dokładność — angielski, turecki i niemiecki korzystają z innej optymalizacji. Narzędzie obsługuje wielostronicowe pliki PDF i układa rozpoznany tekst w tej samej kolejności. Otrzymujesz albo plik PDF z możliwością przeszukiwania (wygląda tak samo, ale z niewidoczną warstwą tekstową pod obrazem) lub zwykły plik .txt.
Jakość danych wejściowych ma znaczenie. Czysty skan w rozdzielczości 300 DPI rozpoznaje niemal idealnie. Niewyraźne zdjęcie wydruku wykonane telefonem będzie zawierało błędy. Narzędzie podaje poziom pewności, dzięki czemu wiesz, jak bardzo ufać wynikom.