3

我无法理解维基百科 API。

我已经隔离了一个链接,通过处理我在向http://en.wikipedia.org/w/api.php发送请求后得到的响应作为响应

假设我获得了以下链接,我如何获得出生日期等信息。

我正在使用python。我试着做一个

import urllib2,simplejson
search_req = urllib2.Request(direct_url_to_required_wikipedia_page)
response = urllib2.urlopen(search_req)

我试过阅读api。但是,我不知道如何从特定页面中提取数据。

4

3 回答 3

5

尝试:

import urllib
import urllib2
import simplejson

url = 'http://en.wikipedia.org/w/api.php'
values = {'action' : 'query',
          'prop' : 'revisions',
          'titles' : 'Jennifer_Aniston',
          'rvprop' : 'content',
          'format' : 'json'}

data = urllib.urlencode(values)
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
json = response.read()

变量 json 是维基百科页面的 json。你现在可以用 simplejson 或其他任何东西来解析它......

于 2012-07-13T13:57:51.613 回答
3

转到MediaWiki API。它更有条理,对人类更友好:-)。

于 2012-07-13T13:52:27.003 回答
1

您不会从 API 中获得诸如出生日期之类的信息,至少不会直接获得。您可以做的最好的事情是获取页面的代码(或呈现的 HTML)并对其进行解析以获取所需的信息。

作为替代方案,您可能想查看DBpedia

于 2012-07-13T14:11:48.137 回答