Tengo una situación en la que necesito extraer imágenes de muchos archivos PDF y mostrarlos en un sitio web. Mis archivos PDF tienen imágenes "normales" y muchos gráficos.
Usé pdf2xml y extrae las imágenes en formatos jpeg, ppm, pbm y vec. Veo que las imágenes "regulares" se extraen (en su mayor parte) como jpeg/ppm/pbm, pero no veo que los gráficos estén allí, así que supongo que pdf2xml los almacena como archivos .vec.
Entonces, la pregunta es ¿cómo obtengo mis gráficos? Usé convert
que viene con imagemagick para convertir .vec a jpeg/png, etc. pero fue en vano.
Respuesta aceptada:
Nunca probé pdf2xml, pero al navegar por sus archivos en SourceForge, encontré vec2svg-2.py, que parece ser un script de Python para convertir archivos .vec a .svg. No debería tener dificultades para convertir SVG al formato que necesite.
python vec2svg-2.py -i file.vec -o file.svg