2

我使用 WYSIWIG html 组件来允许我的客户输入 html 内容,并使用 JSoup 在服务器端对其进行清理。有时(取决于浏览器和用户),提交的内容包含空标签(如<p>)或空白标签(如<br />)。这些很烦人,因为出于所有意图和目的,输入都是空白的,但字符串的长度是非零的。

有谁知道是否有一个 JSoup 设置允许我剔除所有不包含内容的尾随标签?

4

1 回答 1

0

Jsoup 的 getText() 方法可能会对您有所帮助。

如果 <div class="数据">

< br >MY Name is < /br > 
< br>Chirag< /br>
< br> < / br>

</div>

比 Elements data=doc.getElementsByClass("data") ,data.getText() 给你 "My Name is Chirag" 。

于 2012-01-06T14:23:13.067 回答