如果目标是能够将开放的 XML 转换为不太复杂的 XML,那么从 2010 年的 docx 中提取文本和内联标签(粗体、斜体等)的最佳工具是什么?
想到的一个想法是将 docx 转换为另一种格式。如果是这样,您会建议哪种格式以及在哪个程序上(最好是开源的)?
任何其他想法(即不同的方法)?许多工具似乎仍然适用于 MSOffice 2007。即 Xpath、XQuery 和 XSLT 是要走的路吗?如果是,为什么?
请耐心等待。我是这方面的初学者,我也很乐意欢迎有关最好简洁的知识来源的指示。
木糖醇