我想将 HTML 页面转换为 MS Word。我想知道哪些 API 会有所帮助,以及是否有任何其他选项可以做到这一点。将整个页面转换为.doc(例如,如果html页面中有表格,则必须在word doc中创建类似的表格)。Apache POI 不提供将 word 文档格式设置为 HTML 页面中的选项。我需要一些可以给我一个完全格式化的word文档的东西。
我寻求的一些东西是JSOUP
, docx4j
,jasper reports
和JOD Convertor
.
我尝试使用 JSOUP 解析 HTML 页面,并在我的 java 程序中获取页面的内容。现在我需要将这些内容传递给 doc/docx 文件。docx4j 可以帮助获取格式化的 docx 文件吗?
请帮忙。谢谢你。