2

我使用 jsoup-1.5.2 解析 html 标签字符串,我想从 html 字符串中提取纯文本并指定文本的长度,并保持完整的 html 标签。

例如:

html代码:

<p><span>Mike <u>stopp<b>ed</b></u> his work</span></p>

我想要结果:

指定文本长度=4

result:<p><span>Mike</span></p>

指定文本长度=10

result:<p><span>Mike <u>stopp</u></span></p>

指定文本长度=12

result:<p><span>Mike <u>stopp<b>ed</b></u></span></p>

指定文本长度=16

result:<p><span>Mike <u>stopp<b>ed</b></u> his</span></p>

等等

我可以使用 jsoup 完成它吗?

4

1 回答 1

0

不幸的是,使用Element类并不简单。原因是类 Element 中的 'text()' 方法“获取此元素及其所有子元素的组合文本”。这真的很烦人,因为您不能只获取单个元素的文本。您将需要使用ElementsElements.select(String).text()类中的方法,并且可能使用通配符(如果可能)。此方法将返回所有匹配节点的“组合”文本。它作为单个字符串返回,因此您可以在其上调用 String 的 ' ' 方法。length()

于 2011-06-27T13:05:16.613 回答