•
5 min read
•
By Administrator
Cómo hacer OCR a un PDF escaneado y extraer el texto
Convierte PDF escaneados y documentos en imagen en texto buscable y copiable con OCR desde el navegador.
#ocr
#pdf
#scan
#text-extraction
¿Qué es el OCR?
El OCR (Reconocimiento Óptico de Caracteres) lee los píxeles y los convierte en texto real. Es lo que hace que un libro escaneado se pueda buscar, o que puedas copiar un párrafo desde la foto de un cartel.
Cuándo lo necesitas
- Contratos escaneados antiguos donde Ctrl+F no encuentra nada.
- Fotos de tickets que quieres meter en una hoja de cálculo.
- PDF en imagen que quieres pasar a Word.
Cómo hacer OCR
- Abre OCR.
- Sube tu PDF escaneado o imagen.
- Elige el idioma del documento (español, inglés, francés, árabe, etc.).
- Pulsa Ejecutar OCR — tarda unos segundos por página.
- Copia el texto o descárgalo como
.txt.
Consejos de calidad
- Escaneos en alta resolución (300 DPI o más) dan resultados mucho mejores.
- Evita fotos de fotos — escanea el original cuando puedas.
- Para árabe, comprueba que la página no esté inclinada; el OCR es menos tolerante con escrituras de derecha a izquierda.