我正在尝试使用 wikimedia 公共 API 来访问英语维基百科数据库。
我想有一种方法来获取链接到给定页面的所有页面 id。
如果我这样做: http ://en.wikipedia.org/w/api.php?action=query&titles=computer&format=xml
我只能获取“计算机”页面的页面 ID。
我知道我可以解析该页面内的“href”标签并进行 n 次查询,但效率不高。
我可以仅通过 api 实现这一目标吗?
我正在尝试使用 wikimedia 公共 API 来访问英语维基百科数据库。
我想有一种方法来获取链接到给定页面的所有页面 id。
如果我这样做: http ://en.wikipedia.org/w/api.php?action=query&titles=computer&format=xml
我只能获取“计算机”页面的页面 ID。
我知道我可以解析该页面内的“href”标签并进行 n 次查询,但效率不高。
我可以仅通过 api 实现这一目标吗?
看起来您正在寻找backlinks
模块。
有了它,您可以执行以下操作:
http://en.wikipedia.org/w/api.php?action=query&bltitle=computer&list=backlinks&format=xml
此外,API 使用分页,因此您很可能需要添加&bllimit=max
到查询中,然后发出后续请求以获取剩余页面。