php - 如何使用 PHPCrawl 从站点检索特定数据

翻译自：https://stackoverflow.com/questions/20858272 2013-12-31T13:39:32.973

930 次

我正在将 PHPCrawl 用于我想从中接收数据的网站，但我不知道从哪里开始从（例如）具有特定类的跨度中检索数据。

每个示例我想从这个跨度中检索名称“Jan”：

 <span class="firstname">Jan</span>

我曾尝试使用 DOMDocument() 和 DOMXPath() 但在加载 html 字符串时出现错误。

所以这是我到目前为止所拥有的：

 $doc = new DOMDocument();
 $doc->loadHTML($PageInfo->content);
 $xpath = new DOMXPath($doc);

 foreach ($xpath->query("//span[@class='family-name']") as $node) {
     echo "Family name: " . $node . "\n";
 }

但是使用它会产生如下错误：

PHP Notice:  DOMDocument::loadHTML(): Namespace prefix g is not defined in Entity, line: 294 in /var/www/crawl/www/crawl.php on line 30
PHP Warning:  DOMDocument::loadHTML(): Tag g:plusone invalid in Entity, line: 294 in /var/www/crawl/www/crawl.php on line 30

由于我无法更改 html 代码（这是由 PHPCrawl 提取的），我需要做其他事情。然而我不知道是什么。PHPCrawl 本身是否有任何工具可以做到这一点？

php - 如何使用 PHPCrawl 从站点检索特定数据

0 回答 0

Related

Reference