0

我对 docx4j 生成的 html 有一个小问题。在 95% 的情况下,一切正常。但是文档中有一些行,它们被转换成多个具有相同样式的跨度。例如:

我有这样一行:S44_XYZ_ABC_AABBCCDD。文档中有多行这样的行,在转换过程中,只有 1-2% 的行以错误的方式转换。该行变为:

<span style=...>S44</span>
<span style=...>_</span>
<span style=...>XYZ</span>
           ...etc.

因为,我将这些标记替换为生成的 html 字符串中的其他文本,所以这对我来说是个问题。我尝试重新格式化该行,删除它并修改从另一个文档复制的另一个,转换正常,但没有运气。

我认为这是某种与 docx 格式相关的问题,但我无法找出原因。

非常感谢您!

4

1 回答 1

1

Word 可能已将您的文本 S44_XYZ_ABC_AABBCCDD 拆分为多次运行。

它可以出于各种原因执行此操作,包括语法/拼写检查、不同的格式等。要了解为什么会在您的情况下发生这种情况,请解压缩您的 docx,然后查看 word/document.xml

您可以运行VariablePrepare.java来解决此问题的某些原因。

于 2013-09-13T12:44:40.327 回答