0

任何人都可以推荐用于操作文档的 python 模块。我需要可以替换文本中的任何变量(即 $$TITLE$$)而不会丢失格式的模块。Microsoft Word 2003/2007、OpenDocuments 模块需要。

4

2 回答 2

0

自己没有尝试过,但https://github.com/mikemaccana/python-docx似乎是您正在寻找的。有一段时间没有更新,但它是您正在寻找的旧 Word 版本。

于 2013-08-01T08:26:50.893 回答
0

据我所知,没有一个 Python 模块可以通用地操作 Microsoft 和 OpenOffice 文档格式。

也就是说,Microsoft Office 和 OpenOffice(可以)都使用 XML 来存储他们的文档。对于 Office 2003,XML 是可选的,但从 2010 开始,它是默认设置。

因此,您可以遵循两种方法:

  1. quick-and-dirty 使用 XML 工具包和 XPath,选择文档中的 (XML) 文本节点。在每个文本节点上运行您的替换例程。

  2. 整洁但缓慢 研究每种文档类型的 XML 格式。使用 XML 工具包和 XPath,选择将包含(文档)文本的节点。在每个文本节点上运行您的替换例程。

我会从快速而肮脏的开始,看看它能让你走多远。然后,如果您看到更改了您不想更改的节点,则可以基于研究 XML 格式添加临时措施来防​​止这种情况发生。

于 2013-08-01T08:27:28.783 回答