1

我想测试我的基于 html 的搜索引擎,并且我想要一组相对较大的修订文档。是否有存档可以下载并放入我的系统中?我已经阅读了有关 Wikipedia 转储的信息,但我不确定它们是如何格式化的。Intenet Archive 的 Wayback Machine 很好,但服务器很慢。我正在寻找一个档案:

  • 很大但不是很大。像 1000 个文档和 1000 个修订版之类的东西会满足我的项目。我不是在寻找 5 TB 的数据库。
  • 已修订。一个静态的、单一的修订档案是不够的。
  • 我正在寻找 HTML 或可以轻松转换为 HTML 的文档。
4

0 回答 0