0

我正在尝试解析具有唯一类属性的 div 元素的 HTML 网页。我需要从中提取信息。它是多个 div 元素,所以我需要遍历 DOM。但我无法识别 div 元素。

4

2 回答 2

0

切换到Jsoup,真的很棒!

在我看来,您应该使用。它是 Java HTML 解析器。其特点如下。

  • 能够从网络获取网页
  • 非常简单直接的 API
  • CSS 选择器标记 HTML 元素。

例如你想得到一个带有类的 DIV 元素foo

Document doc = Jsoup.connect("http://website.com/").get();
Elements divs = doc.select("div.foo");
于 2015-06-14T07:18:26.297 回答
0

如果您使用 HtmlCleaner 的 JDom 序列化程序,则可以使用 XPath 表达式来定位 div。

于 2015-08-26T09:13:19.110 回答