您能帮我找到一种使用 Goutte 从元描述、元关键字和机器人内容中获取内容的方法吗?另外,我如何定位<link rel="stylesheet" href="">
和<script>
?
下面是我用来获取<title>
内容的 PHP:
require_once 'goutte.phar';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://stackoverflow.com/');
$crawler->filter('title')->each(function ($node) {
$content .= "Title: ".$node->text()."";
echo $content;
});
这是 Goutte 的链接 - https://github.com/fabpot/goutte