我正在努力将 word 文档和 power point 演示文稿转换为 HTML/MHTML 页面。我可以使用 docx4j 将文档转换为 html,但它会失真,并将图像等创建为单独的文件(标准 HTML)。
我有一个要求,用户上传 docx 和 pptx 文件,然后我可以在 Web 浏览器中向他们显示输出 HTML。所以我需要从文档中输出一个 *.mht 文件。MS word aby 将文件保存为 mht 生成的输出类型很棒。我想要类似的功能,但仅限于纯 Java。
我将在 Linux 上部署该服务,因此甚至无法调用 Ms Office 的本机命令。
任何帮助将不胜感激。
谢谢