1

HYPERLINK“目标”标签

如何从 HWPF 文档中提取超链接?我可以从 doc 文件中获取段落并在必要时提取正确的样式,即粗体、斜体等。但是我将如何识别和提取段落中的超链接?

4

1 回答 1

0

正如您所注意到的,.doc 格式不会以最简单的方式存储超链接...

超链接将是单个 CharacterRun,上面带有特殊标记。检测到它后,只需根据引号拆分文本即可。

在 Apache Tika 中有一个很好的例子,看看 WordExtractor 的handleSpecialCharacterRuns方法看看它完成了。

于 2011-12-01T10:47:47.017 回答