我正在尝试从 xml 解析维基百科页面。我正在使用 Special:Export 链接来获取带有如下链接的页面的 xml:
http://en.wikipedia.org/wiki/Special:Export/Bruce_Willis
但是当我尝试获取文件或类别页面时,我无法使用此链接,例如,此页面不返回 xml:
http://en.wikipedia.org/wiki/Special:Export/Category:English-language_films
http://en.wikipedia.org/wiki/Special:Export/File:Bruce_Willis_by_Gage_Skidmore.jpg
我找到了一个解决方案,但我不明白:
- 将命名空间作为页面名称的前缀(例如“Help:Contents”),除非选定的命名空间是主命名空间。
- 对其他命名空间重复上述步骤(例如 Category:、Template: 等)
我在http://meta.wikimedia.org/wiki/Help:Export找到了这个解决方案。请问这是什么意思。
谢谢你。