1

我有这个 html 代码(长 html 代码的一部分):

<div class="yt-lockup-content">
<h3 class="yt-lockup-ellipsize">
    <a class="yt-uix-contextlink yt-uix-sessionlink yt-uix-tile-link result-item-translation-title"dir="ltr"title="Rihanna ft. Calvin Harris - We Found Love LYRICS"data-sessionlink="ved=CAoQvxs%3D&amp;ei=CPLZjMDLwbICFUag3wod7Dm-pw%3D%3D"href="***/watch?v=1KzEu5hWmRY***">Rihanna ft. Calvin Harris - We Found Love LYRICS</a></h3><p class="description " dir="ltr">
        <b>bla</b> ft. Calvin Harris - 
        <b>bla</b> 
        bla bla
        <b>bla bla bla</b> 
        <b>...</b>
        </p><div class="yt-lockup-meta">    
        <ul class="single-line-lego-list">
      <li>    <a href="/results?search_type=videos&amp;search_query=rihanna+we+found+love&amp;high_definition=1" class="yt-badge-std">HD
      </a> 
</h3>   

我想得到这个文本:href=/watch?v=1KzEu5hWmRY(粗体文本)。我知道如何获得所有线路,但我怎样才能抓住这个文本?谢谢,或者。

4

1 回答 1

0

这是一个例子:

String html = // your html here ...

Document doc = Jsoup.parse(html);

Element element = doc.select("h3[class=yt-lockup-ellipsize] > a").first();
String hrefLink = element.attr("href");

但是,如果你想解析一个网站,你应该使用Jsoup.connect("http://link.com").get()而不是Jsoup.parse(html)

于 2012-09-19T14:07:23.457 回答