我使用 odt 文件作为某种模板,并使用 Libre Office 作为创建此模板的工具。它通常工作正常,除了一件事。
假设我们的 odt 文件有一段文本。
There is my text.
XML 文件可能看起来也可能不看起来(似乎是随机的)(杂乱无章,对于解析或作为模板来说不是很好的东西):
<text:p text:style-name="P7">There is</text:p><text:p text:style-name="P7"> my text<text:p text:style-name="P7">.</text:p></text:p>
有时它(再次看起来是随机的)是这样的(预期的结果,毕竟是有道理的):
<text:p text:style-name="P7">There is my text.</text:p>
有没有办法摆脱多余的 xml 标签?或者至少用户可以在 LibreOffice/OpenOffice 中查看原始文档以手动删除冗余?
关键是为用户提供简单的工具,以检测和修复这样的伪像。