PDFLabz PDFLabz
5 min read By Administrator

Cómo hacer OCR a un PDF escaneado y extraer el texto

Convierte PDF escaneados y documentos en imagen en texto buscable y copiable con OCR desde el navegador.

#ocr #pdf #scan #text-extraction

¿Qué es el OCR?

El OCR (Reconocimiento Óptico de Caracteres) lee los píxeles y los convierte en texto real. Es lo que hace que un libro escaneado se pueda buscar, o que puedas copiar un párrafo desde la foto de un cartel.

Cuándo lo necesitas

  • Contratos escaneados antiguos donde Ctrl+F no encuentra nada.
  • Fotos de tickets que quieres meter en una hoja de cálculo.
  • PDF en imagen que quieres pasar a Word.

Cómo hacer OCR

  1. Abre OCR.
  2. Sube tu PDF escaneado o imagen.
  3. Elige el idioma del documento (español, inglés, francés, árabe, etc.).
  4. Pulsa Ejecutar OCR — tarda unos segundos por página.
  5. Copia el texto o descárgalo como .txt.

Consejos de calidad

  • Escaneos en alta resolución (300 DPI o más) dan resultados mucho mejores.
  • Evita fotos de fotos — escanea el original cuando puedas.
  • Para árabe, comprueba que la página no esté inclinada; el OCR es menos tolerante con escrituras de derecha a izquierda.