我有以下要解析的 HTML 代码
谁能告诉我如何只选择框中的 p 标签。或者谁能告诉我如何删除红线下方的标签?此外,还有大量不需要的 p 标签
div class="SPOSTARBUST-Related-Posts"
但
document.select("div.SPOSTARBUST-Related-Posts").remove();
似乎什么也没做
如果您只想选择<p>
红色框中的标签,如您所见,您可以找到的唯一条件是style="text-align: justify"
.
使用JSoup 选择器语法,您可以这样做
Elements paragraphs = doc.select("p[style*=justify]");
您应该使用以下选择器
div[id=content] > p
像这样
final String html = "<head><body/><div id=\"content\"><p>a</p><p>b</p><div><p>v</p></div></div></html>";
final Document doc = Jsoup.parse(html);
final Elements ps = doc.select("div[id=content] > p");
System.out.println(ps.size());
这将 p
返回div[id="content"]
.