我正在尝试按照页面上显示的顺序或合理关闭的顺序从特定页面获取链接。我相信我使用解析请求找到了正确的 API 调用,但是我注意到我得到了很多我认为的“垃圾”链接,这些链接实际上是在引用中完成的链接。例如,对于阿尔伯特·爱因斯坦,我执行请求(http://en.wikipedia.org/w/api.php?action=parse&format=json&page=Albert%20Einstein&redirects=&prop=links),我将获得出现在ET Whittaker 和 JSTOR 等参考资料。出于我的目的,参考文献中的这些链接是“垃圾”。
或者,我查看了查询命令,但发现带有 prop=link 的查询命令最终只会给我按字母顺序排列的链接,这会丢失我想要查看的部分信息。此外,此 API 查询还包括参考中的这些“垃圾”链接。
无论如何,我是否可以告诉 parse 命令忽略引用标签中的链接,或者我是否需要使用 API 检索文本,然后自己在客户端进行解析?