PDF OCR — Metin Çıkar
Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.
Завантаження…
Як виконати OCR для PDF
-
1
Завантажте сканований PDFПеретягніть файл до зони завантаження. Підтримуємо скани до 100 МБ, сотні сторінок.
-
2
Оберіть мову документаВкажіть основну мову тексту для збільшення точності розпізнавання. Можна обрати кілька мов.
-
3
Завантажте PDF з розпізнаним текстомНатисніть «Розпізнати» й отримайте PDF, у якому можна виділяти, копіювати й шукати текст.
Для кого це?
PDF OCR стане в пригоді всім, хто застряг зі сканами, у яких неможливо шукати чи копіювати текст, — студентам, що оцифровують старі підручники, юристам, які витягують пункт із відсканованого договору, і бухгалтерам, що архівують паперові рахунки. Уявіть, що ви сфотографували друковану сторінку й тепер вам потрібен один абзац із неї: запустіть OCR — і ви зможете виділити та скопіювати цей текст просто в лист чи Word, замість того щоб передруковувати його вручну.
Допоможіть нам покращитися
Оцініть цей інструмент, ваш відгук важливий!
Що таке OCR для PDF?
OCR (Оптичне розпізнавання символів) перетворює сканований PDF на редагований і пошуковий документ. Зображення з текстом стає текстом, який можна копіювати, шукати й редагувати.
Ми використовуємо запатентовану технологію оптичного розпізнавання символів, вдосконалену роками для досягнення найвищої можливої точності. 100+ мов, включаючи турецьку, англійську, німецьку, іспанську, арабську, японську, китайську — ваші скановані зображення перетворюються на справжній текст для пошуку.
Під капотом OCR сканує кожну сторінку в пошуках обрисів літер і цифр, зіставляє їх із навченими моделями символів і записує результат назад у вигляді прихованого текстового шару, вирівняного по тому місцю, де слова розташовані на зображенні. Оскільки оригінальне зображення сторінки залишається недоторканим, документ виглядає абсолютно так само — різницю ви помітите лише під час пошуку, виділення чи копіювання. Що чистіше джерело, то кращий результат: чіткі скани 300 DPI, рівні сторінки й хороший контраст дають майже бездоганний текст, тоді як перекошені, розмиті або зняті за слабкого освітлення зображення додають помилок. Вибір правильної мови документа також допомагає рушію розпізнавати схожі символи та літери з діакритикою. Після завершення PDF з можливістю пошуку працює в будь-якій програмі для читання й готовий до архівування, індексації або подальшого редагування.
Чому OCR з PDF7?
50+ мов
Навчені моделі для всього, від англійської до старогрецької. Виберіть свою мову для максимальної точності.
Висока точність
Точність 95-99% на якісних сканах. Підтримка багатоколонкових макетів і таблиць.
Збереження макета
Текст розпізнається поверх зображення — сторінки виглядають як були.
Пошук і копіювання
Після OCR можна шукати текст усередині PDF, копіювати й виділяти. Зручно для архівів.
Часті питання
Яка точність розпізнавання?
Наша система оптичного розпізнавання символів досягає 95-99% точності при чистих сучасних скануваннях (300 DPI, добре освітлення). Старі, вицвілі або скановані зображення з низькою роздільною здатністю зменшуються до 80-90%. Відскануйте ще раз або зробіть чіткішу фотографію для кращих результатів.
Чи працює з рукописним текстом?
Наш OCR навчається на друкованому тексті. Курсивний почерк здебільшого нерозбірливий. Друк блоків олівцем іноді працює — спробуйте і переконайтеся.
Чи зберігається оригінальний вигляд?
Так, текст накладається поверх зображення. Сторінки виглядають однаково, але текст копіюється.
Скільки триває OCR?
Близько 2-5 секунд на сторінку. Документ зі 100 сторінок — 5-10 хвилин.
Чи змінює OCR вигляд мого PDF?
Ні. Оригінальні зображення відсканованих сторінок залишаються точно такими ж. PDF7 лише додає невидимий текстовий шар за зображенням, тож файл виглядає ідентично, але стає доступним для пошуку та виділення. Шрифти, штампи, підписи й макет залишаються на своїх місцях.
Чи є обмеження за розміром файлу або кількістю сторінок?
Ви можете обробити багатосторінкові документи за один раз; великі відскановані PDF на десятки MB обробляються без проблем. Сторінки із зображеннями дуже високої роздільної здатності просто потребують трохи більше часу на обробку. Якщо файл надзвичайно великий, попереднє розбиття його на менші PDF пришвидшить процес.