GNU/Linux >> Tutoriales Linux >  >> Linux

¿Extraer gráficos de PDF?

Tengo una situación en la que necesito extraer imágenes de muchos archivos PDF y mostrarlos en un sitio web. Mis archivos PDF tienen imágenes "normales" y muchos gráficos.

Usé pdf2xml y extrae las imágenes en formatos jpeg, ppm, pbm y vec. Veo que las imágenes "regulares" se extraen (en su mayor parte) como jpeg/ppm/pbm, pero no veo que los gráficos estén allí, así que supongo que pdf2xml los almacena como archivos .vec.

Entonces, la pregunta es ¿cómo obtengo mis gráficos? Usé convert que viene con imagemagick para convertir .vec a jpeg/png, etc. pero fue en vano.

Respuesta aceptada:

Nunca probé pdf2xml, pero al navegar por sus archivos en SourceForge, encontré vec2svg-2.py, que parece ser un script de Python para convertir archivos .vec a .svg. No debería tener dificultades para convertir SVG al formato que necesite.

python vec2svg-2.py -i file.vec -o file.svg

Linux
  1. ¿Extraer archivo de la imagen de Docker?

  2. ¿Mosaico con muchas imágenes de la terminal?

  3. ¿Extraer valores de la terminal?

  4. ¿Problemas de transferencia de fotos desde la cámara?

  5. gImageReader:extraiga texto de imágenes y PDF en Linux

Cómo crear un montaje a partir de imágenes en Linux

Cómo extraer direcciones de correo electrónico de un archivo de texto en Linux

Cómo crear un video a partir de imágenes en Linux

extraer tiempo promedio de ping -c

¿Cómo extraer texto con OCR de un PDF en Linux?

Extraer fechas de /etc/shadow