我想获取一个类别及其子类别下的所有文章名称。
我知道的选项:
- 使用维基百科 API。有这样的选择吗??
- d/l 转储。哪种格式更适合我的使用?
- 还有一个在 Wikipedia 中搜索类似的选项
incategory:"music"
,但我没有看到在 XML 中查看的选项。
请分享你的想法
我想获取一个类别及其子类别下的所有文章名称。
我知道的选项:
incategory:"music"
,但我没有看到在 XML 中查看的选项。请分享你的想法
您可以通过以下两种 API 方法做到这一点:
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtitle=Category:Music
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtype=subcat&cmtitle=Category:Music
您可以获取有关Mediawiki API的更多信息
请注意,维基百科的分类系统不是树,甚至不是无环图。通过不断关注子类别链接,您很可能最终会回到您开始的地方。
如果您要进行许多此类查询,最好下载数据库转储。如果这将是一件不常见的事情并且只会处理小类别,那么您可能会通过对list=categorymembers
.
incategory:"music"
似乎没有进行子类别搜索。