Hola, creo que no necesitas escribir un programa para tu propósito, me refiero a leer un archivo pdf en modo consola porque less
el comando ya lo hace por ti. Así que úsalo y disfrútalo.
less "the name of pdf file"
También está el visor de PDF verde. Hay una demostración en YouTube.
Ok, pediste saber incluso los "mierdos". Aquí hay dos (decide tú mismo sobre su respectiva porquería):
Primero:txtwrite
de Ghostscript dispositivo de salida
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
Segundo:pdftotext
de XPDF Utilidad CLI (mejor que Ghostscript):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
Esto mostrará el rango de páginas 13 (f primera página) a 17 (l última página), conserve el diseño de un archivo PDF protegido con contraseña doble (utilizando contraseñas de usuario y propietario secret y supersecreto ), con la convención EOL de Unix, pero sin insertar saltos de página entre páginas PDF, canalizado a través de menos...
pdftotext -h
muestra todas las opciones de línea de comandos disponibles.
Por supuesto, ambas herramientas solo funcionan para las partes de texto de los PDF (si las tienen). Ah, y la fórmula matemática tampoco funcionará muy bien...;-)
Editar: Había escrito mal el comando anterior (originalmente usando pdftops
en lugar de pdftotext
).