我想将 html 或 xhtml 文档(最好带有样式)转换为 Microsoft .doc 和/或 .docx 格式。
似乎有很多相反的例子可以做到这一点,但我还没有找到任何有用的例子来转换为 ms 文档格式。
任何人都可以指点我一个api或提供一个这样做的例子吗
非常感谢
docx4j 2.8.0 支持将 XHTML 文档和片段转换为 docx 内容。披露:我写了一些代码。
另一个解决方案是使用jodconverter,它似乎是基本的 html 到 doc 转换......虽然它并没有声称做得很好
我尝试了 docjx4j API 2.8.1,效果很好。它有 ConvertinXHTMLinFile 并且工作正常。如果有人想要代码,我会发布它。
这是帮助我的链接:ConvertInXHTMLFile
为了使用 Microsoft Documents,您可能需要更深入地了解Apache 的 POI 库。
然而,从 (X)HTML 创建带有样式的 .doc 文件需要一些努力。
我花了一点时间研究docx4j。它似乎提供了从 docx 创建 html 文档的好方法,但反过来我看不到任何东西。
目前这看起来仍然是最简单的方法,因为它只是使用 jaxb 对象(我认为)。