GNU/Linux >> Tutoriales Linux >  >> Linux

python convierte documentos de microsoft office a texto sin formato en linux

La herramienta habitual para convertir documentos de Microsoft Office a HTML u otros formatos era mswordview, que desde entonces pasó a llamarse vwWare.

Si está buscando una herramienta de línea de comandos, en realidad recomiendan usar AbiWord para realizar la conversión:

AbiWord --to=txt

Si está buscando una biblioteca, comience en la página de descripción general de wvWare. También mantienen una lista de bibliotecas y herramientas que leen documentos de MS Office.


Yo optaría por la solución de línea de comandos (y luego usaría el módulo de subproceso de Python para ejecutar las herramientas desde Python).

Conversores para msword (catdoc ), excel (xls2csv ) y ppt (catppt ) se puede encontrar (en forma de fuente) aquí:http://vitus.wagner.pp.ru/software/catdoc/.

Realmente no puedo comentar sobre la utilidad de catppt, ¡pero catdoc y xls2csv funcionan muy bien!

Pero asegúrese de buscar primero en los repositorios de sus distribuciones... En ubuntu, por ejemplo, catdoc es solo una salida rápida de apt.


Puede acceder a OpenOffice a través de la API de Python.

Intente usar esto como base:http://wiki.services.openoffice.org/wiki/Odt2txt.py


Linux
  1. Cómo instalar Python en Linux

  2. Cómo instalar Python en Linux Mint 20

  3. ¿Modificar un correo entrante de texto/sin formato a texto/html?

  4. Cómo instalar Python 3.10 en Rocky Linux 8

  5. Actualice python en linux 2.7 a 3.5

Instalar python 3 en Redhat 8

Cómo instalar Microsoft Edge en Linux

Cómo convertir una página web a PDF en Linux

Cómo instalar Microsoft OneNote en Linux

Distribución Linux de Microsoft:CBL-Mariner

Ubuntu Linux – yED (Editor de gráficos) Alternativa de Microsoft Office Visio