2

我正在尝试为自己编写一个简单的 Python 应用程序来获取 Wikipedia 上某个主题的内容。例如,我试图在 fruit apple上获取页面的内容。这是我的查询:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=apple

这是输出(格式化)的样子:

http://pastebin.com/LNdDjXFj

但这看起来并不像 XML。它看起来更像(我认为)php。我应该尝试用 Python 解析它还是有更好的方法?

4

1 回答 1

0

这不是 PHP,它是媒体 wiki 格式。

查看格式化 mw 页面:http ://www.mediawiki.org/wiki/API:Parsing_wikitext

就个人而言,json 格式的版本对我来说看起来更好(一旦解析)。

于 2012-05-23T21:57:56.087 回答