在工作中,我们有一个 word 文档,我们必须一直编辑它才能传递给另一个团队,告诉他们如何执行某些任务。因为我不喜欢盲目地填写数据,而且我总是想方设法简化我必须做的任务,所以我决定让这个过程自动化。在考虑了几种方法(例如从头开始生成 word 文档或编辑现有文档)后,我决定就地编辑文档。
我在文档中插入了特殊标签(具体来说,它们采用的形式[SOME_NAME_HERE]
),然后我将解析文档中的那些特殊标签,并将它们替换为我实际需要的值。然后,我将 .docx 提取到其中包含所有 XML 文档的文件夹,并解析document.xml
文件,替换值。
在此过程中,根据实际需要,文档的某些部分必须从中删除。所以我的第一个想法是在document.xml
文件中添加注释。例如:
<!-- INITIAL BUILD ONLY -->
<w:p w:rsidR="00202319" w:rsidRPr="00D00FF5" w:rsidRDefault="00202319" w:rsidP="00AC0192">
<w:r w:rsidR="00E548A2" w:rsidRPr="00D00FF5">
<w:rPr>
<w:rStyle w:val="emcfontstrong"/>
</w:rPr>
<w:t>Some text here</w:t>
</w:r>
</w:p>
<!-- END INITIAL BUILD ONLY -->
然后,当我生成输出 word 文档时,我会简单地删除所有“仅初始构建”的部分(当然,除非它是初始构建)。
但是,我遇到的问题是,当您将文档转换回 Word 文档、在 Word 中打开并保存时,它会“清理”文档,并删除我添加到其中的所有评论。
所以,我的问题是,有什么方法可以保留文档中的注释,或者是否有任何特殊标签可以添加到 XML 中,这些标签在文档的标准查看/编辑期间不可见,但不会被救人的话?