php - WebScraping之间的延迟

翻译自：https://stackoverflow.com/questions/14608909 2013-01-30T16:30:21.240

296 次

-3

我正在使用网页抓取来使用简单的 PHP DOM 解析器类从某个网站获取数据我面临的问题很少。

有两个网站返回错误 HTTP 403 禁止
其次，根据下面的代码，我在 8 个 URL 之后从 9 个 URLS 中抓取 9 个产品，我收到错误，我对 url 进行洗牌并检查单个但它不是 url，它的执行时间或 Web 请求可能被允许，因为我得到 Appache windows 错误。我尝试使用 sleep(10) 来延迟它；它没有任何帮助将不胜感激
```
      $url = $this->urls['abc'].'Product/1/1_oz_Gold_American_Eagle___Random_Year.aspx';
        $regex = 'span[id=ctl10_ctl00_tc1_TabPnlProdDesc_lblbuyprice]';
          $data=$this->getCoinVal($url,$regex);     

                   $this->update_scrap(GAE_1,APMEX,strip_tags($this->r_dollar($data)),$url);
```

2 回答 2

2

在括号 () 中使用它来延迟时间

  import time

  time.sleep(sec)

于 2016-11-02T06:02:37.167 回答

0

那么错误是由于apache服务器中的内存泄漏造成的

所以使用这两行将使它工作。

              $dom->clear();  
              unset($dom);

其中 $dom 是解析器类的对象

于 2013-02-02T07:15:29.700 回答