我正在尝试从维基百科转储中提取跨语言链接。这些链接似乎已移至 WikiData 项目,并且仅通过 API 提供访问权限。
此分支解释了如何处理该问题并建议切换到 API: 从导出的 Wikipedia 文章中检索跨语言链接?
但是,我的研究范围似乎太大而无法使用 Web API(数百万个查询)。有谁知道是否可以从 API 以外的任何地方提取这些链接?解析任何大小的转储比查询 API 更可取。
我使用的维基百科转储:http: //dumps.wikimedia.org/backup-index.html
我使用的 WikiData 转储:http: //dumps.wikimedia.org/wikidatawiki/latest/