0

我有将多个DOCX文件转换为HTML格式的要求,如果可能的话RTF
Docx4j,它似乎是一个很好的 java 库。
使用 HtmlExporterNG2.html 方法并不一定会为我提供所需的结果。所以我正在考虑修改从 docx 文件中提取的样式表,然后将其用于此转换,因为所有这些 docx 文件都有不同的格式,因此不能使用标准样式表。
我认为对样式表进行运行时修补会起作用吗?我应该注意哪些重要事项?
我将它用作具有 Java 版本 6 的独立 Java 应用程序。
我的查询可能有点模糊,但我正在寻找正确的方向。

4

1 回答 1

0

@Jason 我想忽略输入文档中的某些格式。由于转换后的 html 添加了一些额外的间距或垃圾字符等。

作为解决方案,我创建了一个新的 xslt。对于大多数人来说,它与示例中的非常相似,但几乎没有细微的调整。新的 xslt 现在可以将输入的 docx 文件转换为适用于 IE8、Mozilla 或 Chrome 的正确格式(根据我的需要)的 html。

于 2013-03-20T09:38:08.870 回答