1

我在 Google App Engine for PHP 上使用 XPath 时遇到问题。

所以我有以下代码:

function getDataXpath($url_str, $xpath_exp_str)
{
    $doc = new DOMDocument();
    libxml_use_internal_errors(true);
    $doc->loadHTMLFile($url_str);
    libxml_use_internal_errors(false);

    $xpath = new DOMXpath($doc);
    $elements = $xpath->query("".$xpath_exp_str."");

    if (!is_null($elements)) {
        return $elements;
    }

    return false;
}

然后我只是像这样运行它来获取节点:

getDataXpath($url_str, $xpath_exp_str);

因此,在我的本地 PHP 安装(v 5.5.19)上,当我运行以下命令时:

$url_str = 'http://www.alexa.com/topsites/category;0/Top/Shopping';
$xpath_exp_str = "//ul/li[@class='site-listing']/div/p/a";
$xpath_data = getDataXpath($url_str, $xpath_exp_str);
print_r($xpath_data);

我得到以下结果:

DOMNodeList Object ( [length] => 25 ); 

这是正确的。

但是,当我在 Google App Engine for PHP (v 5.5.26) 上运行相同的代码时,我得到以下信息:

DOMNodeList Object ( [length] => 0 ); 

有没有人遇到过这个问题,你是如何解决的?

4

1 回答 1

1

因此,亚马逊似乎阻止了对 Alexa TopSites 页面的编程访问。我实际上订阅了他们的新 API,但它不允许您像在网站上那样对响应(例如顶级电子商务网站)进行分类,这就是我求助于 XPath 的原因。

我在其他一些 URL 上尝试了相同的脚本,但没有任何问题。

无论如何,当我在本地(在浏览器和命令行中)运行它时它可以工作,所以我现在只需要跳过 Google App Engine。这是一个破碎的工作流程,特别是因为这是更大的自动化工作的一部分,但此时它不在我的掌控之中。

于 2015-12-15T19:24:37.127 回答