0

我有以下要解析的 HTML 代码 截屏

谁能告诉我如何只选择框中的 p 标签。或者谁能​​告诉我如何删除红线下方的标签?此外,还有大量不需要的 p 标签

div class="SPOSTARBUST-Related-Posts"

document.select("div.SPOSTARBUST-Related-Posts").remove();

似乎什么也没做

4

2 回答 2

1

如果您只想选择<p>红色框中的标签,如您所见,您可以找到的唯一条件是style="text-align: justify".

使用JSoup 选择器语法,您可以这样做

Elements paragraphs = doc.select("p[style*=justify]");
于 2012-11-21T08:02:22.410 回答
1

您应该使用以下选择器

div[id=content] > p

像这样

    final String html = "<head><body/><div id=\"content\"><p>a</p><p>b</p><div><p>v</p></div></div></html>";
    final Document doc = Jsoup.parse(html);

    final Elements ps = doc.select("div[id=content] > p");
    System.out.println(ps.size());

p返回div[id="content"].

于 2012-11-21T07:59:44.927 回答