Cómo hacer OCR a un PDF escaneado y extraer el texto

Convierte PDF escaneados y documentos en imagen en texto buscable y copiable con OCR desde el navegador.

#ocr #pdf #scan #text-extraction

¿Qué es el OCR?

El OCR (Reconocimiento Óptico de Caracteres) lee los píxeles y los convierte en texto real. Es lo que hace que un libro escaneado se pueda buscar, o que puedas copiar un párrafo desde la foto de un cartel.

Cuándo lo necesitas

Contratos escaneados antiguos donde Ctrl+F no encuentra nada.
Fotos de tickets que quieres meter en una hoja de cálculo.
PDF en imagen que quieres pasar a Word.

Cómo hacer OCR

Abre OCR.
Sube tu PDF escaneado o imagen.
Elige el idioma del documento (español, inglés, francés, árabe, etc.).
Pulsa Ejecutar OCR — tarda unos segundos por página.
Copia el texto o descárgalo como .txt.

Consejos de calidad

Escaneos en alta resolución (300 DPI o más) dan resultados mucho mejores.
Evita fotos de fotos — escanea el original cuando puedas.
Para árabe, comprueba que la página no esté inclinada; el OCR es menos tolerante con escrituras de derecha a izquierda.

Cómo hacer OCR a un PDF escaneado y extraer el texto

¿Qué es el OCR?

Cuándo lo necesitas

Cómo hacer OCR

Consejos de calidad

Keep reading

Cómo unir archivos PDF gratis en línea

Cómo comprimir un PDF sin perder calidad

Cómo dividir un PDF y extraer páginas