2

我想为我的项目使用维基百科转储。我的项目需要以下信息。

  1. 对于 wikipedia 条目,我想知道包含该页面的其他语言是什么?
  2. 我想要 csv 或其他常见格式的可下载数据。

有没有办法获取这些数据?

谢谢巴拉

4

3 回答 3

1

维基媒体基金会提供其所有项目的 XML 转储,包括英语维基百科。

为跨语言链接解析英文 wiki 文章相当容易:此类链接的语法是[[language_code:Name of other language Wikipedia article]],其中 language_code 通常是两个或三个字母的代码(例如tlh克林贡语),基于 ISO 标准,除了少数例外,例如simple简单英语。

于 2010-09-13T23:07:03.027 回答
1

维基媒体在download.wikimedia.org上提供了不同格式的维基百科转储。

于 2010-09-14T02:59:01.200 回答
0

我会回答这个问题,即使它已经过时了,因为事情已经发生了变化:现在有了Wikidata

Wikipedia 文章中的所有链接都已删除,现在 Wikidata 将它们全部托管:您可以检查一个项目(例如,Q42 “Douglas Adams”),“链接到该项目的维基百科页面”部分将为您提供指向该项目的附加链接所有不同的维基百科。

在这里您可以找到Wikidata API,或者您可以使用Special:Export页面以 XML 格式检索文章。

于 2014-12-19T08:12:11.800 回答