是否可以下载一个类别的所有维基百科页面(例如http://en.wikipedia.org/wiki/Category:Births_by_year)及其所有子类别?
问题是特定页面没有用最顶层类别标记,并且使用 Wikimedia API 的每个页面跟踪非常长。是否可以使用某些工具批量下载?
是否可以下载一个类别的所有维基百科页面(例如http://en.wikipedia.org/wiki/Category:Births_by_year)及其所有子类别?
问题是特定页面没有用最顶层类别标记,并且使用 Wikimedia API 的每个页面跟踪非常长。是否可以使用某些工具批量下载?
不,这是不可能的,因为类别是如何制作的。你必须自己走类别。另请参阅http://lists.wikimedia.org/pipermail/analytics/2013-December/thread.html#1368上的讨论
对于特定类别,您只需使用 Special:Export 并在其中添加类别而不是标题列表。假设您的意思是“下载”的 wikitext 导出;如果你想要 HTML,你唯一的选择是 API 中的渲染模块,或者 parsoid。