我有一个通过使用Document doc =jsoup.connect(someUrl).get()
和提取的html片段Elements body=doc.select("div.chapter")
String myHtml = "
<div class="chapter">
<h1>Hello this is my example</h1>
<p>This is paragraph one</p>
<p>This is paragraph two <sup class="num">Nuisance 1</sup><span class="notes">Nuisance 2</span></p>
<p>This is paragraph three</p>
</div>"
我想用 JSOUP 删除它们的内容<sup> </sup>
。<span> <\span>
我读过使用正则表达式语法是个坏主意。大多数示例和答案都解决了这个问题以删除标签并保留内容。我想得到的是:
String newHtml = "
<div class="chapter">
<h1>Hello this is my example</h1>
<p>This is paragraph one</p>
<p>This is paragraph two</p>
<p>This is paragraph three</p>
</div>"
我使用 JSOUP 没有令人满意的结果(它保留了 SUP 和 SPAN 实体/标签。)。