Muchos de los documentos que recibe vienen en formato PDF. A veces, esos archivos PDF deben manipularse. Por ejemplo, es posible que deba eliminar o agregar páginas, o que deba firmar o cambiar una página específica.
Ya sea para bien o para mal, esta es la realidad en la que todos vivimos.
Existen algunas herramientas de interfaz gráfica de usuario sofisticadas que le permiten editar archivos PDF, pero siempre me he sentido más cómodo con la línea de comandos. De las muchas herramientas de línea de comandos para esta tarea, las que uso cuando quiero modificar un PDF son qpdf
y poppler-utils
.
Instalar
En Linux, puede instalar qpdf
y poppler-utils
usando su administrador de paquetes (como apt
o dnf
.) Por ejemplo, en Fedora:
$ sudo dnf install qpdf poppler-utils
En macOS, use MacPorts o Homebrew. En Windows, usa Chocolatey.
qpdf
El qpdf
El comando puede hacer mucho, pero lo uso principalmente para:
- Dividir un PDF en páginas separadas
- Concatenación o combinación de archivos PDF en un solo archivo
Para dividir un PDF en páginas separadas:
qpdf --split-pages original.pdf split.pdf
Esto genera archivos como split-01.pdf
, split-02.pdf
, y así. Cada archivo es un archivo PDF de una sola página.
Concatenar archivos es un poco más sutil:
qpdf --empty concatenated.pdf --pages split-*.pdf --
Esto es lo que qpdf
hace por defecto. El --empty
La opción le dice a qpdf que comience con un archivo vacío. Los dos guiones (--
) al final indica que no hay más archivos para procesar. Este es un caso en el que los parámetros reflejan un modelo interno, en lugar de para lo que la gente lo usa, pero al menos se ejecuta y produce archivos PDF válidos.
poppler-utils
Contenido relacionado
Este paquete contiene varias utilidades, pero la que más uso es pdftoppm, que convierte archivos PDF en mapas de píxeles portátiles (ppm
) archivos de imagen. Normalmente lo uso después de dividir páginas con qpdf
y necesito convertir una página específica en una imagen que pueda modificar. Las ppm
El formato no es muy conocido, pero lo importante es que la mayoría de los métodos de manipulación de imágenes, incluidos ImageMagick, Pillow y muchas otras opciones, funcionan con él. La mayoría de estas herramientas también pueden volver a guardar archivos en PDF.
Flujo de trabajo
Mi flujo de trabajo habitual es:
- Usar
qpdf
para dividir el PDF en páginas. - Utilice
poppler-utils
para convertir las páginas que deben cambiarse en imágenes. - Modifique las imágenes según sea necesario y guárdelas en PDF.
- Usar
qpdf
para concatenar las páginas en un solo PDF.
Otras herramientas
Hay muchos comandos de código abierto excelentes para manejar archivos PDF, ya sea que los esté reduciendo, creándolos a partir de archivos de texto, convirtiendo documentos o haciendo todo lo posible para evitarlos por completo. ¿Cuáles son sus utilidades de PDF de código abierto favoritas? Compártelos en los comentarios.