我有一个以 WordProcessingML 格式保存为 XML 的 Word 2003 文档。它包含很少的占位符,这些占位符将被适当的内容动态替换。但是,问题在于 Word 似乎将它们随机拆分为单独的单词。例如,而不是这个:
<w:t>${dl.d.out.ecs_rev}</w:t>
我有这个:
...
<w:t>${</w:t>
</w:r>
<w:r wsp:rsidR="005D11C0">
<w:rPr>
<w:sz w:val="20" />
<w:sz-cs w:val="20" />
</w:rPr>
<w:t>dl.</w:t>
</w:r>
<w:r wsp:rsidRPr="00696324">
<w:rPr>
<w:sz w:val="20" />
<w:sz-cs w:val="20" />
</w:rPr>
<w:t>d.out.ecs_rev}</w:t>
...
有没有办法使用 Word 2003 保存“干净”的 XML 文档,或者是否有任何现有的解决方案可以进行清理?
我试图用 Java 编写一个方法来连接占位符的分离部分,但由于不同切割组合的数量相对较大,因此该算法比我必须做的原始任务复杂得多,所以它是问题本身。