1

我在使用 Wikipedia API 时遇到问题。我使用这个 PHP 脚本,

<?php
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

我在浏览器中有以下结果。为什么?

警告:DOMDocument::load(http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml) [domdocument.load]:打开流失败:HTTP 请求失败!HTTP/1.0 403 Forbidden in D:\Program Files\VertrigoServ\www\wiki\index.php 第 3 行

警告:DOMDocument::load() [domdocument.load]:I/O 警告:未能加载外部实体“http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format =xml”在 D:\Program Files\VertrigoServ\www\wiki\index.php 第 3 行

4

2 回答 2

2
<?php
  $vars = array(
    'http' => array(
      'user_agent' =>'whatever'));
  $context = stream_context_create($vars);
  libxml_set_streams_context($context);
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

不要问我为什么需要用户代理,但我在 SO 上看到越来越多的相同问题,所有这些都可以通过提供用户代理来解决。


编辑: 以下也可以工作(在这里):

<?php
  ini_set('user_agent','whatever');
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

也许 PHP 中的默认设置user_agent已更改?

于 2010-09-23T21:20:07.120 回答
2

对于 MediaWiki 的用户代理政策: http: //meta.wikimedia.org/wiki/User-Agent_policy

于 2012-09-19T14:37:46.557 回答