Hay xpdf que incluye el pdftotext
binario.
Pdftotext convierte archivos de formato de documento portátil (PDF) en texto sin formato.
En Linux hay un instalador disponible. Parece que también viene en el poppler-utils
paquete. En OS X, puede instalarlo usando Homebrew (instale eso primero) y luego use
brew install homebrew/x11/xpdf
que descargará los archivos fuente y los compilará para OS X. Después de eso, utilícelo como:
pdftotext your_pdf_file.pdf
que generará un archivo de texto sin formato. También hay un par de opciones, echa un vistazo a man pdftotext
para más detalles.
Una alternativa es poppler, en OSX:
brew install poppler
en Debian y amigos
apt-get install poppler-utils