如何在 Ubuntu 上使用 Python 提取 ODT(OpenDocumentText) 文件中的表格、文本和图片以将它们输出到另一个 ODT 文件?
问问题
871 次
OOoPy似乎很合适。我没用过,但是它自带文档和代码示例,而且可以读写ODT文件。
一种简单的方法是将其重命名foo.odt
为foo.zip
然后提取它。提取的目录包含许多文件,包括图片。
但是我认为最好将其类型更改为docx
然后执行该过程docx
(提取它)。因为它提取名称更好的图像(image1,image2,...)。