我想尝试从 wikipedia 获取网球运动员的描述,而不会刮伤运动员 x 上的 DOM 页面。这是不允许的,而且很无聊。所以,我希望有人可以回答我唯一的问题。
我可以用 Wikipedia API 做什么?我可以轻松获取有关网球运动员收藏的信息吗?或者此 API 不适用于此。如果没有,我需要有人告诉我这个 API 的目的是什么,因为我不理解文档。
您可以获取这样的文章:
http://en.wikipedia.org/w/index.php?title=Stackoverflow&printable=yes
或使用 API:
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Stack%20Overflow&rvprop=content
这将为您提供原始文章代码。要获取 html 版本,请使用action=parse
:
http://en.wikipedia.org/w/api.php?action=parse&format=json&page=Stack_Overflow
看看Wikipedia API Sandbox - 你可以使用它来尝试获取你需要的信息。
要从页面获取信息,您可以使用parse操作。
为了获取丹麦网球运动员 Caroline Wozniacki 的信息,我使用了parse动作和json格式。在我粘贴
的标记为pageCaroline_Wozniacki
的字段中,我按下了Make Request。
这给了我这个 URL:http
://en.wikipedia.org/w/api.php?action=parse&format=
json&page=Caroline_Wozniacki 这包含带有链接、引用和所有 JSON 格式的页面。