0

我遇到了 simplehtmldom 的问题,我已将其追踪到此代码块。我有大约 70 个不同的 url 要抓取,但我的循环只经过两个。在第二次迭代中,file_get_html($url) 仅将页面的一部分返回到 $html。嵌入的 foreach 循环将运行并打印出部分页面,然后它将我踢出两个循环,而不会击中最后一次打印。最奇怪的部分是它没有给出警告或错误。

foreach($urls as $url)
        {    
            $html = file_get_html( $url );
            $appList = $html->find("loc");
            foreach($appList as $each)
            {
                print "$each \n";
            }
            print "hello\n";

        }

请不要给出忽略第二个 $url 并继续下一次迭代的答案。我需要每一页上的所有信息

4

1 回答 1

0

我通过使用普通的正则表达式和 curl 解决了这个问题。这是一个 xml 页面,所以

preg_match_all("@<loc.*?\/loc>@",$curlHTML,$locTags)

工作得很好,但我从来没有弄清楚 simple_html_dom 发生了什么

于 2013-09-06T20:54:21.817 回答