大家好,我希望从维基百科获取我在我的数据库中的条目的信息,例如一些体育场馆和国家信息。我正在使用 Zend 框架,以及如何处理返回多个不明确条目等的查询。我希望在这里能得到所有帮助...
问问题
5056 次
3 回答
11
Wikipedia 基于 MediaWiki,提供应用程序可编程接口 (API)。
您可以在 Wikipedia 上查看 MediaWiki API - http://en.wikipedia.org/w/api.php
MediaWiki API 文档 - http://www.mediawiki.org/wiki/API
于 2009-05-11T10:37:59.830 回答
2
对您要导入的文章执行一个简单的HTTP 请求。这是一个很好的库,它可能有助于解析 HTML,尽管也有许多解决方案,包括使用 php 提供的标准 DOM 模型。
<?php
require_once "HTTP/Request.php";
$req =& new HTTP_Request("http://www.yahoo.com/");
if (!PEAR::isError($req->sendRequest())) {
echo $req->getResponseBody();
}
?>
请注意,如果您的流量水平被认为太高,您将被锁定在该网站之外。(如果您想要大量文章,请下载数据库)
于 2009-05-11T10:33:22.880 回答
2
这个博客有一个非常好的代码,可以从 wiki 获取定义
<?php
//FUNCTION THAT :PARAMETER - KEYWORD , AND RETURNS WIKI DEFINITION (IN ARRAY FORMAT)
function wikidefinition($s) {
//ENGLISH WIKI
$url = "http://en.wikipedia.org/w/api.php?action=opensearch&search=".urlencode($s)."&format=xml&limit=1";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_HTTPGET, TRUE);
curl_setopt($ch, CURLOPT_POST, FALSE);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_NOBODY, FALSE);
curl_setopt($ch, CURLOPT_VERBOSE, FALSE);
curl_setopt($ch, CURLOPT_REFERER, "");
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_MAXREDIRS, 4);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.1; he; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8");
$page = curl_exec($ch);
$xml = simplexml_load_string($page);
if((string)$xml->Section->Item->Description) {
return array((string)$xml->Section->Item->Text,
(string)$xml->Section->Item->Description,
(string)$xml->Section->Item->Url);
} else {
return "";
}
}
//END OF FUNCTION WIKIDEFINITIONS
//USE OF FUNCTION
$data = wikidefinition('Bangladesh') ;
//var_dump( wikidefinition('bangladesh') ) ; //displays the array content
echo "Word:" . $data[0] . "<br/>";
echo "Definition:" . $data[1] . "<br/>";
echo "Link:" . $data[2] . "<br/>";
?>
于 2013-12-17T14:37:48.007 回答