Comment faire l'OCR d'un PDF scanné et en extraire le texte

Transformez vos PDF scannés et documents en image en texte recherchable et copiable grâce à l'OCR dans le navigateur.

#ocr #pdf #scan #text-extraction

Qu'est-ce que l'OCR ?

L'OCR (reconnaissance optique de caractères) analyse les pixels et les transforme en vrai texte. C'est ce qui rend un livre scanné recherchable, ou ce qui vous permet de copier un paragraphe depuis la photo d'un panneau.

Quand l'utiliser

Anciens contrats scannés où Ctrl+F ne trouve rien.
Photos de tickets de caisse que vous voulez saisir dans un tableur.
PDF en image que vous voulez convertir en Word.

Comment lancer l'OCR

Ouvrez OCR.
Téléversez votre PDF scanné ou votre image.
Choisissez la langue (français, anglais, arabe, espagnol, etc.).
Cliquez sur Lancer l'OCR — comptez quelques secondes par page.
Copiez le texte ou téléchargez en .txt.

Conseils qualité

Les scans en haute résolution (300 DPI ou plus) donnent de bien meilleurs résultats.
Évitez les photos de photos — scannez l'original quand vous le pouvez.
Pour l'arabe, assurez-vous que la page n'est pas inclinée ; l'OCR pardonne moins les écritures de droite à gauche.

Comment faire l'OCR d'un PDF scanné et en extraire le texte

Qu'est-ce que l'OCR ?

Quand l'utiliser

Comment lancer l'OCR

Conseils qualité

Keep reading

Comment fusionner des fichiers PDF gratuitement en ligne

Comment compresser un PDF sans perdre en qualité

Comment diviser un PDF et extraire des pages