2

我需要访问法语非常古老的维基百科转储(维基百科的备份)。我成功地从archive.org 找到了2010 年的备份,现在我正在搜索2006 年甚至更早的版本。我知道在最新的转储中包含以前的所有数据,但我需要在我的计算机中设置一个 Wikipedia 版本,例如 2006、2010、2012 中的版本。一件事情——我猜——用最新的转储是不可能的。

非常感谢您的帮助。

4

3 回答 3

3

维基媒体基金会在其网站上提供了访问一些旧转储的途径。请注意,其中一些使用与当前 Wikipedia 不同的架构,因此您可能需要在使用它们时修改您的工具。

Archive.org上还提供更多档案。

于 2015-09-05T09:18:02.007 回答
2

似乎有 2006 年 11 月的静态 HTML 转储,可在此处获得: http: //dumps.wikimedia.org/other/static_html_dumps/

此外,如果您获得完整的转储(带有编辑历史记录),您可以过滤它以删除某个日期之后的所有修订 - 然后您应该能够在该日期查看它(除了后来删除的材料,等等不在垃圾场)。

于 2015-03-16T16:46:54.987 回答
1

不幸的是,维基媒体并没有保留所有的历史转储(除了其他人指出的少数例外)。

鉴于您的用例,我强烈建议使用 JWPL Wikipedia Revision Toolkit: https ://dkpro.github.io/dkpro-jwpl/WikipediaRevisionToolkit/

具体来说,您可能会喜欢“Time Machine”包,它允许您重建维基百科在过去某个日期的状态。 https://dkpro.github.io/dkpro-jwpl/TimeMachine/

虽然我没有专门使用该功能,但我已经将 Revision Toolkit 用于其他目的取得了巨大的成功。JWPL 包还包含其他非常有用的工具。

于 2016-12-01T15:38:54.170 回答