-3

我正在使用网页抓取来使用简单的 PHP DOM 解析器类从某个网站获取数据我面临的问题很少。

  1. 有两个网站返回错误 HTTP 403 禁止
  2. 其次,根据下面的代码,我在 8 个 URL 之后从 9 个 URLS 中抓取 9 个产品,我收到错误,我对 url 进行洗牌并检查单个但它不是 url,它的执行时间或 Web 请求可能被允许,因为我得到 Appache windows 错误。我尝试使用 sleep(10) 来延迟它;它没有任何帮助将不胜感激

          $url = $this->urls['abc'].'Product/1/1_oz_Gold_American_Eagle___Random_Year.aspx';
            $regex = 'span[id=ctl10_ctl00_tc1_TabPnlProdDesc_lblbuyprice]';
              $data=$this->getCoinVal($url,$regex);     
    
                       $this->update_scrap(GAE_1,APMEX,strip_tags($this->r_dollar($data)),$url);
    
4

2 回答 2

2

在括号 () 中使用它来延迟时间

  import time

  time.sleep(sec)
于 2016-11-02T06:02:37.167 回答
0

那么错误是由于apache服务器中的内存泄漏造成的

所以使用这两行将使它工作。

              $dom->clear();  
              unset($dom);

其中 $dom 是解析器类的对象

于 2013-02-02T07:15:29.700 回答