Herramientas OCR que pueden usarse en Linux

El reconocimiento óptico de caracteres (ocr) es una tecnología que permite transformar material impreso o gráfico digital en texto editable. Hasta hace unos años no existía una alternativa viable de código abierto o compatible con Linux, aunque la cosa mejoró bastante. Vamos a mencionar algunas alternativas disponibles. Las 3 primeras están basadas en el motor de código abierto Tesseract, la última es un servicio privativo en la nube con versiones gratuitas y de pago.
Leer más “Herramientas OCR que pueden usarse en Linux”

Anuncios

Nueva versión de Gscan2pdf, programa para el tratamiento de imágenes escaneadas y su conversión a pdf

gscan2pdf v1.3.3_028
Gscan2pdf es un programa que permite adquirir imágenes mediante escáneres y del disco rígido, combinarlas, modificarlas y convertirlas en pdf. También permite hacer un reconocimiento óptico de caracteres mediante Tesseract que para mi gusto no funciona del todo bien. La última versión disponible es la 1.3.3
Leer más “Nueva versión de Gscan2pdf, programa para el tratamiento de imágenes escaneadas y su conversión a pdf”

Instalar la última versión de Gscan2pdf en Ubuntu y derivados

Gscan2pdf es un programa que convierte los documentos escaneados en formato pdf y djvu permitiendo además el reconocimiento óptico de carácteres y el envío del documento por mail.

Procedimiento de instalación
Desde la terminal
sudo add-apt-repository ppa:jeffreyratcliffe/ppa

sudo apt-get update

sudo apt-get install gscan2pdf

Nota: Todavía no hay repositorio para Oneric Ocelot
Más información