Cómo hacer ocr de imágenes usando estos programas

Poder hacer ocr de imágenes resulta muy útil cuando navegamos por sitios que no adminten copia o recibimos correos electrónicos con imágenes que contienen texto. Ocr son las siglas en inglés de reconocimiento óptico de caracteres.

Uno de los programas que vamos a usar; gImageReader, también permite trabajar junto a un escáner, pero en este post nos vamos a concentrar en el trabajo con capturas de pantalla.

Programas para hacer ocr de imágenes

Los programas que vamos a usar son dos:

  • Flameshot para la capturas de pantalla (En Windows lo puedes reemplazar por la herramienta Recortes)
  • gImageReader para el reconocimiento óptico de caracteres

Flameshot

Flameshot nos permite seleccionar un sector de la pantalla, dibujar sobre él, copiarlo, subirlo a Imgur o enviarlo a una aplicación
Flameshot nos permite seleccionar un sector de la pantalla, dibujar sobre él, copiarlo, subirlo a Imgur o enviarlo a una aplicación

Solo tenemos que pulsar sobre el lanzador de Flameshot y seleccionar la región de la pantalla correspondiente. A continuación pulsamos en la herramienta que queremos utilizar. En nuestro caso en la de copiar.

FlameShot está disponible en los repositorios de Arch Linux, Fedora, Debian y Ubuntu. A mi el paquete de la tienda de Snap no me funciona.

gImageReader

Hacer ocr de imágenes con gImageReader es muy fácil
gImageReader realiza el reconocimiento del texto y lo muestra al lado de la imagen.

Es una interfaz gráfica para Tesseract, una herramienta de código abierto para el reconocimiento óptico de caracteres. Entre sus características están:

  • Importa documentos pdf e imágenes PDF desde discos, dispositivos de digitalización, portapapeles y capturas de pantalla.
  • Puede procesar múltiples documentos e imágenes de una sola vez
  • Definición del área de reconocimiento en forma manual o automática
  • El resultado se envía a texto plano o en formato hOCR.
  • El texto reconocido se muestra al lado de la imagen.
  • Al texto reconocido puede aplicársele un post procesado y corrector ortográfico.
  • Los resultados en formato hOCR pueen utilizarse para crear documentos pdf.

gImageReader está disponible en los repositorios de Fedora, Debian y Archlinux (repositorio de la comunidad). La versión de OpenSuse puede conseguirse aquí, y la de Windows aquí. Para instalar en Ubuntu, hacemos:

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt update
sudo apt install gimagereader-gtk

Si no tienes instalado Tesseract

sudo apt install tesseract-ocr tesseract-ocr-spa

Si te dice que falta el diccionario español

sudo apt install hunspell-spa

Cómo hacer ocr de imágenes.

Pulsamos el lanzador de Flameshot y seleccionamos la porción de la pantalla que queremos copiar. Sin cerrar el programa abrimos gImageReader. Ya puedes cerrar los otros programas.

Pantalla de inicio de gImageReader
gImageReader nos permite usar imágenes guardadas, copiadas o adquiridas desde un escáner

En el menú verde seleccionamos Paste para pegar el archivo copiado.

gImageReader nos permite seleccionar varios idiomas y sus variantes

Seleccionamos el idioma y sus variantes en el menú y pulsamos el botón para el reconocimiento.

Resultado del reconocimiento de textos con gImageReader

En el caso del ejemplo de las fotos, el reconocimiento con texto plano se hizo sin inconvenientes. Sin embargo, al usar el formato hOCR, me muestra una palabra por línea.

Más información

Flameshot

gImageReader

Anuncios

Autor: Diego Germán Gonzalez

Autor de contenidos relacionados con el managment, la productividad personal y la tecnología.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.