2

我能够使用这个问题作为解析“mht”文件的起点,但是锚标签中的“3D”(例如<a href=3D"[my anchor]">[anchor text]></a>:)破坏了所有内部链接和嵌入图像。我可以让解析器用“=”(例如:)替换“=3D” <a href="[my anchor]">[anchor text]></a>,它似乎工作正常,但我想了解那个“元标记”的目的。

为什么从“.docx”导出到“.mht”会在大多数(如果不是全部)html 属性的右侧添加“3D”?是否有更好的方法来处理它们或替换它们时使用更好的正则表达式?

4

1 回答 1

3

=3D引用的可打印编码的结果。找到一个用于解码引用的可打印数据的 java 库应该不难。

于 2012-08-28T22:40:45.040 回答