我使用 foreach 循环遍历多个种子 URL。在每个循环中,我使用 PHPCrawl 和下一个种子 URL 实例化一个爬虫。
foreach($companyUrls as $companyId => $companyUrl) {
$crawler = new MyCrawler($companyUrl, $companyId);
$crawler->go();
}
它在第一个循环中运行良好,但在完成任何爬网之前第二次抛出以下错误:
"Call to undefined method stdClass::receivePage() in
/data/utilities/PHPCrawl_070/classes/phpcrawler.class.php on line 201"
我没有以任何方式修改原始的 PHPCrawl V0.70 类。如 PHPCrawl 文档中所述,我只扩展了 PHPCrawler 类并将过程代码添加到 handlePageData() 函数。如果我在没有 foreach 循环的情况下运行它(一次用新的 url 实例化一个新类),系统工作正常。
请帮忙!!