2

我想尝试从 wikipedia 获取网球运动员的描述,而不会刮伤运动员 x 上的 DOM 页面。这是不允许的,而且很无聊。所以,我希望有人可以回答我唯一的问题。

我可以用 Wikipedia API 做什么?我可以轻松获取有关网球运动员收藏的信息吗?或者此 API 不适用于此。如果没有,我需要有人告诉我这个 API 的目的是什么,因为我不理解文档。

4

2 回答 2

2

您可以获取这样的文章:

http://en.wikipedia.org/w/index.php?title=Stackoverflow&printable=yes

或使用 API:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Stack%20Overflow&rvprop=content

这将为您提供原始文章代码。要获取 html 版本,请使用action=parse

http://en.wikipedia.org/w/api.php?action=parse&format=json&page=Stack_Overflow

还可以查看文档:http ://www.mediawiki.org/wiki/API

于 2012-04-17T09:07:10.020 回答
2

看看Wikipedia API Sandbox - 你可以使用它来尝试获取你需要的信息。

要从页面获取信息,您可以使用parse操作。

为了获取丹麦网球运动员 Caroline Wozniacki 的信息,我使用了parse动作和json格式。在我粘贴
的标记为pageCaroline_Wozniacki的字段中,我按下了Make Request

这给了我这个 URL:http
://en.wikipedia.org/w/api.php?action=parse&format= json&page=Caroline_Wozniacki 这包含带有链接、引用和所有 JSON 格式的页面。

于 2012-04-17T09:16:07.833 回答