pdf7

PDF OCR — Metin Çıkar

Taranmış PDF'lerden metni OCR ile çıkarın. 14 dil desteği, Text/Word/PDF olarak dışa aktarın.

ou glissez-déposez
Préparation de 1 PDF…
pdf7.org
1 fichier

Téléversement…

0%
PDF prêt
Votre fichier est prêt. Cliquez sur le bouton pour le télécharger.
Télécharger le PDF
Vos fichiers sont traités dans la mémoire temporaire et effacés instantanément une fois terminé.
Cet outil vous a aidé ? Partagez-le — d’autres en auront besoin aussi
Pas de filigrane Traitement rapide Sécurisé : les fichiers ne sont jamais stockés Gratuit, sans inscription

Comment OCR un PDF scanné

  1. 1
    Téléchargez votre PDF scanné.
    Déposez un PDF qui contient des pages scannées. La plupart des scanners modernes enregistrent en PDF; les caméras enregistrent en JPG (utilisez Image en Texte à la place pour ceux-là).
  2. 2
    Choisissez votre langue.
    Sélectionnez la langue principale du document. Choisir la bonne langue améliore considérablement la précision. Vous pouvez en choisir plusieurs si votre PDF mélange les langues.
  3. 3
    Téléchargez le PDF cherchable.
    Un nouveau PDF se télécharge où chaque page a maintenant une couche de texte invisible. Ouvrez dans n'importe quel lecteur PDF, Ctrl+F pour chercher, copier du texte, même coller dans Word.

À qui s'adresse cet outil ?

L'OCR pour PDF s'adresse à tous ceux qui sont coincés avec des scans qu'ils ne peuvent ni rechercher ni copier : étudiants numérisant de vieux manuels, avocats extrayant une clause d'un contrat scanné, comptables archivant des factures papier. Imaginez que vous ayez photographié une page imprimée et qu'il vous faille désormais un paragraphe : lancez l'OCR et vous pourrez sélectionner et copier ce texte directement dans un e-mail ou dans Word, au lieu de le retaper à la main.

Aidez-nous à nous améliorer

Notez cet outil, votre avis est précieux !

Qu'est-ce que PDF OCR?

OCR (Optical Character Recognition) est une technologie qui convertit les PDF numérisés en documents modifiables et consultables. Convertissez des images contenant du texte en données textuelles pouvant être copiées, recherchées et modifiées.

Nous utilisons une technologie OCR exclusive, perfectionnée au fil des années pour la plus grande précision possible. Plus de 100 langues, dont le turc, l'anglais, l'allemand, l'espagnol, l'arabe, le japonais et le chinois : vos numérisations deviennent de véritables textes consultables.

En coulisses, l'OCR analyse chaque page à la recherche des formes des lettres et des chiffres, les compare à des modèles de caractères entraînés et réécrit le résultat sous forme de couche de texte invisible, alignée à l'endroit où les mots apparaissent dans l'image. Comme l'image d'origine de la page reste intacte, le document a exactement le même aspect : vous ne remarquez la différence qu'au moment de rechercher, de surligner ou de copier. Plus la source est nette, meilleur est le résultat : des scans nets à 300 DPI, des pages bien droites et un bon contraste produisent un texte quasiment parfait, tandis que des captures de travers, floues ou prises en faible lumière introduisent des erreurs. Sélectionner la bonne langue du document aide aussi le moteur à distinguer les caractères qui se ressemblent et les lettres accentuées. Une fois terminé, le PDF consultable fonctionne dans n'importe quel lecteur et est prêt à être archivé, indexé ou modifié.

Pourquoi OCR avec PDF7?

100+ langues

Modèles formés pour tout, de l'anglais au vieux grec. Choisissez votre langue pour une meilleure précision.

Mise en page préservée

Les images de page originales restent; nous ajoutons juste une couche de texte invisible par-dessus. Le PDF a l'air inchangé mais est maintenant cherchable.

Pas d'abonnement

Adobe facture 20 $/mois pour l'OCR. Nous le donnons gratuitement, pas d'inscription requise.

Fichiers restent privés

Traités en mémoire, supprimés après téléchargement. Nous ne lisons ni n'entraînons jamais sur vos scans.

Questions fréquentes

Quelle est la précision de l'OCR?

Notre moteur OCR atteint une précision de 95 à 99 % sur des numérisations modernes et épurées (300 DPI, bien éclairées). Les numérisations anciennes, décolorées ou à faible résolution chutent à 80-90 %. Re-scannez ou prenez une photo plus claire pour de meilleurs résultats.

L'OCR fonctionnera-t-elle sur l'écriture manuscrite?

Notre OCR est formé sur le texte imprimé. L’écriture cursive est en grande partie illisible. L’impression en bloc au crayon fonctionne parfois – essayez-la et voyez.

Puis-je OCR un PDF qui a déjà du texte?

Vous pouvez, mais c'est inutile — le texte est déjà là. Nous n'OCRons que les pages où aucune couche de texte n'est détectée.

Combien de temps cela prend-il?

Environ 1-2 secondes par page sur un scan propre. Un livre de 100 pages prend environ 2-3 minutes. Les images plus grandes prennent plus de temps.

L'OCR change-t-il l'apparence de mon PDF ?

Non. Les images d'origine des pages scannées restent exactement telles quelles. PDF7 ajoute seulement une couche de texte invisible derrière l'image, si bien que le fichier paraît identique mais devient consultable et sélectionnable. Les polices, les tampons, les signatures et la mise en page restent tous en place.

Y a-t-il une limite de taille de fichier ou de pages ?

Vous pouvez traiter des documents de plusieurs pages d'un seul coup ; les PDF scannés volumineux, de plusieurs dizaines de MB, sont gérés sans souci. Les pages d'images en très haute résolution demandent simplement un peu plus de temps. Si un fichier est exceptionnellement volumineux, le diviser au préalable en PDF plus petits accélérera le traitement.

Utile ? Partagez-le

Pour que d’autres l’utilisent gratuitement — une seconde suffit.

Ce site utilise des cookies pour améliorer votre expérience. Politique de confidentialité

Ajoutez PDF7 à votre appareil : sur iPhone/iPad, touchez Partager, puis 'Ajouter à l'écran d'accueil'. Sur ordinateur, cliquez sur l'icône d'installation dans la barre d'adresse.