0

我想使用 html 清洁器解析这种类型的 html。

<div class="result-item yt-uix-tile yt-tile-default *sr">
    <div class="thumb-container">
      <a href="/watch?v=NZiEqhrIL_k" class="ux-thumb-wrap contains-addto result-item-thumb">
        <span class="video-thumb ux-thumb yt-thumb-default-138 ">
            <span class="yt-thumb-clip">
                <span class="yt-thumb-clip-inner">
                  <img onload="tn_load(2)" alt="Thumbnail" src="//i3.ytimg.com/vi/NZiEqhrIL_k/default.jpg" width="138" >
                  <span class="vertical-align"></span>
                </span>
            </span>
        </span>
  <span class="video-time">2:40</span>

在其中我只想获得 href ( href="/watch?v=NZiEqhrIL_k" )值。我怎样才能实现它。提前致谢。

4

1 回答 1

0

快速而肮脏,在 javascript 中,

因此,对于您返回的每一行,设置 thisLine:

var thisLine = "<a href=\"/watch?v=NZiEqhrIL_k\" class=\"ux-thumb-wrap contains-addto result-item-thumb\">";

然后找到你想要的位的开始和结束:

var startPos = thisLine.indexOf("<a href=\"/watch?");  
    thisLine = thisLine.substring(startPos+2);
var endPos = thisLine.indexOf("class=");
    thisLine = thisLine.substring(0,endPos-1);

可能有 1000 种方法可以做到这一点...查看右侧的相关parse html response问题,或搜索.

于 2012-05-01T00:47:56.717 回答