1

我有一个如下的html文件

...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...

在这我想提取值作为A和B。
你能推荐任何可以轻松做到这一点的java html解析器库吗?

4

3 回答 3

3

就个人而言,我更喜欢JSoup而不是JTidy。它有类似 CSS 的选择器,而且文档要好得多,恕我直言。使用 JSoup,您可以使用以下几行轻松提取这些值:

Document doc = Jsoup.connect("your_url").get();
Elements spans = doc.select("span[itemprop]");

for (Element span : spans) {
  System.out.println(span.text()); // will print 234 and 690
}
于 2012-08-15T14:21:16.877 回答
1

http://jsoup.org/

JSoup 是要走的路。

于 2012-08-15T14:16:15.847 回答
1

JTidy是一个名称混乱但受人尊敬的 HTML 解析器。

于 2012-08-15T14:17:18.737 回答