Herramientas OCR que pueden usarse en Linux

El reconocimiento óptico de caracteres (ocr) es una tecnología que permite transformar material impreso o gráfico digital en texto editable. Hasta hace unos años no existía una alternativa viable de código abierto o compatible con Linux, aunque la cosa mejoró bastante. Vamos a mencionar algunas alternativas disponibles. Las 3 primeras están basadas en el motor de código abierto Tesseract, la última es un servicio privativo en la nube con versiones gratuitas y de pago.

Gscan2pdf

Gscan2pdf es una herramienta para el reconocimiento óptico de caracteres.

Es una interfaz gráfica para Tesseract que se ocupa del reconocimiento óptico propiamente dicho. Además dispone de herramientas de edición gráfica para mejorar la lectura. El resultado puede guardarse como pdf o djvu.
Gscan2pdf puede escanear el documento o abrir uno ya escaneado (también puede ser una captura de pantalla u otro archivo de imagen o pdf creados a partir de un texto).
El resultado final, además de guardarse en los formatos mencionados. también puede imprimirse o enviarse por mail.
Ten presente que deberás ajustar las opciones del gráfico hasta obtener un resultado óptimo en la lectura.

Instalación

Gscan2pdf está disponible en los repositorios de las principales distribuciones. Ten presente que deberás instalar manualmente el paquete tesseract-ocr-spa.

En Ubuntu y derivados puedes instalar la última versión haciendo:
sudo add-apt-repository ppa:jeffreyratcliffe/ppa
sudo apt-get update
sudo apt install gscan2pdf tesseract-ocr-spa

En Debian y derivados puedes descargar el paquete deb desde aquí

Más información

gImageReader

gImageReader es otra interfaz gráfica para Tesseract con funciones de captura de pantalla y copiado desde el portapapeles además de importar desde el escáner.

Otra interfaz para Tesseract con binarios para Windows y presencia en los repositorios de la mayor parte de las distribuciones Linux.

Entre sus funciones:
-Importación de pdf o imagen desde escáner, disco, capturas de pantalla y portapapeles.
-Procesamiento simultáneo de varios documentos.
-Reconocimiento a texto plano o formato hocr.
-Reconocimiento de texto pegado a imágenes.
-Postprocesamiento del texto reconocido incluyendo chequeo de gramática.
-Generación de pdf a partir de documentos hocr.

Ten en cuenta que si la imagen o el documento a reconocer es del disco tiene que estar en la carpeta imágenes.

Recuerda que deberás instalar el paquete tesseract-ocr-spa.
Más información

OCRFeeder

OCRFeeder, parte del proyecto Gnome es la más completa de las hasta ahora analizadas.

De la mano del proyecto Gnome llega esta herramienta que está presente en los repositorios de las distros que usen ese escritorio.
Es la más completa de las aplicaciones vistas hasta ahora ya que antes del reconocimiento analiza el diseño del documento.

Cargadas las imágenes, automáticamente perfila su contenido, distingue entre gráficos y texto y ejecuta el ocr sobre éste último. Puede exportar en formatos compatibles con LibreOffice, además de texto plano, html y pdf.

La interfaz gráfica permite a los usuarios corregir cualquier carácter no reconocido, definir o corregir los cuadros de delimitación, establecer estilos de párrafo, limpiar las imágenes de entrada, importar pdf, guardar y cargar el proyecto, exportar todo a múltiples formatos, etc.

Es la que mejor resultado da, ya que además de ser interfaz gráfica de Tesseract también permite procesar el documento con otra herramienta de código abierto llamada Unpaper.
De hecho es la única hasta ahora que con el mismo documento de origen sin procesar obtuvo un resultado razonable.
Una vez más recuerda instalar manualmente tesseract-ocr-spa.

Más información

Abby Finereader Online

Subiendo un documento para reconocer en Adobe Finereader online.

Si no conoces la línea editorial de este blog debo informarte que para mi solo existen dos tipos de software; el que me funciona y el que no. Abby Finereader es privativo, pero también es la mejor herramienta de reconocimiento de textos que existe y de hecho la causa de que durante muchos años siguiera usando Windows XP.
Como dato curioso hace mucho tenían un motor ocr para Linux pero nunca se molestaron en desarrollar una interfaz gráfica.

Lo que ahora nos ocupa es su versión en la nube que puedes usar desde el navegador. (hasta 10 páginas por mes en la versión gratuita). Puede exportarse a los formatos de Microsoft Office, pdf y los formatos epub y fbr de libros electrónicos.
El resultado puede enviarse a un servicio de almacenamiento en la nube o guardado en tu equipo.
Más información

Publicidad

 

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s