Hay varios lectores de OCR para Linux que pueden convertir de imagen a texto. Mira las siguientes opciones:
- GOCR:página de Wikipedia
- Ocrad:página de Wikipedia
- ocropus:página de Wikipedia
- tesseract-ocr:página de Wikipedia
Todos los anteriores, excepto ocropus, están presentes en el repositorio de Ubuntu en un paquete del mismo nombre.
Los diferentes lectores admiten diferentes formatos de imagen, por lo que sus opciones pueden estar limitadas por el formato de archivo en el que se encuentra su documento. Alternativamente, puede usar la herramienta de conversión de ImageMagick para cambiar el formato si desea usar un lector de OCR en particular.
Adaptado de mi respuesta aquí.