我正在尝试用 Goutte 抓取 Facebook 页面,以收集页面的“创建日期”。这不能通过 Graph API 访问。
在测试中,我能够从 tutsplus 和 symfony-project 之类的页面中检索所有链接,但是当我尝试访问诸如“ https://www.facebook.com/151116474914629 ”之类的页面时,它会返回不正确的“ 2”链接。
代码:
use Symfony\Component\DomCrawler\Crawler;
use Goutte\Client as Goutte;
public function goutte()
{
$url_to_traverse = 'https://www.facebook.com/151116474914629';
$client = new Goutte();
$crawler = $client->request('GET', $url_to_traverse);
$status_code = $client->getResponse()->getStatus();
if($status_code==200){
$a_count = $crawler->filter('a')->count();
}
return $a_count;
}
关于检索整页内容的任何想法?