-1

我写了一个 PHP 脚本来抓取亚马逊产品的产品评论页面链接。但是,在浏览产品页面时遇到问题。[亚马逊每页仅显示 12 种产品]。

我的脚本使用了 Simple HTML Dom Parser。

这是我的脚本的一部分,它跟随到下一页产品的链接:

 if($nextPage=$html->find('#pagnNextLink',-1)) {
    $next = "http://amazon.com".$nextPage->href;

  // This works: 
// $next = "http://www.amazon.com/s/ref=sr_pg_2/179-2481337-1920701?rh=n%3A2625373011%2Cn%3A%212625374011%2Cn%3A2649512011%2Cp_n_date%3A2693527011%2Cp_n_theme_browse-bin%3A2650365011%2Cp_n_format_browse-bin%3A2650305011&page=2&ie=UTF8&qid=1372370539";

    echo "<p>".$next;


   getProducts($next);
}

问题:最初加载到函数的基本页面不断被加载,并且没有访问在当前页面中找到的下一页链接。

但是,注释行在上面的代码片段中有效。:\ 有任何想法吗?

4

1 回答 1

0

id错了

<a title="Next Page" id="pagnNextLink" class="pagnNext" href="/s/ref=sr_pg_2?rh=i%3Aaps%2Ck%3Atoothbrush&amp;page=2&amp;keywords=toothbrush&amp;ie=UTF8&amp;qid=1372374734">
            <span id="pagnNextString">Next Page</span>
            <span class="srSprite pagnNextArrow"></span>
         </a>

正确的 id 应该是#pageNextLink

于 2013-06-27T23:13:37.577 回答