0

我正在使用 JSOUP 来提取数据。我有一个 html 文件:

=
<ul>
<li>
<i>
<a class="Class1" title="title1" href=""www.title1.com">title1</a>
</i>
(one)
</li>
<li>
<i>
<a title=title2" href="www.title2.com">title2</a>
</i>
(two)
</li>
<li>
<i>
<a title="title3" href=""www.title2.com">title3</a>
</i>
(three)
</li>
</ul>

如何使用 JSOUP 打印 title1,title2 和 title3, 2) 如何打印 href?

4

1 回答 1

0

相当容易:

Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String title1 = link.attr("title");

//etc.

你看过这里吗?

还要确保 HTML 格式正确。例如匹配引号

上面的 HTML 输出格式不正确,例如:

<a class="Class1" title="title1" href=""www.title1.com">title1</a>
                                       ^ extra quote

<a title=title2" href="www.title2.com">title2</a>
         ^ missing quote

JSoup需要有效的 HTML。

于 2012-08-18T02:30:06.027 回答