0

我们的 Solr 应用程序每天向 Solr 索引添加大约 1 GiB 的数据。应用程序仅访问最近 N 天的数据,但是必须保存所有数据以供将来使用。为了节省主服务器上的空间(昂贵),我想导出数据并将其保存在本地存储中(便宜)。MySQL具有出色的mysqldump功能,可以根据需要轻松导出和导入数据。Solr 是否有类似的功能可以在不关闭 Solr 应用程序的情况下激活?

我感兴趣的特定关键功能:

  1. Solr 运行时工作,无需停机。

  2. 导出数据子集,例如datetime:[1356220800 TO 1356393600]

  3. 导入数据

我感兴趣的特定非关键功能:

  1. 能够搜索导出的数据以查找要插入的子集(使用常见的 GNU 工具,例如grep或小型独立工具。

  2. 内在数据压缩。

4

1 回答 1

3

您可以检查:-

  • Solr备份- 将允许您在同一台服务器上备份索引。您可以重复使用该索引,因为它是一个成熟的 Solr 索引
  • 复制- 您可以定期复制每个并在不同的 Solr 服务器上维护索引。这基本上是导出和导入,因为它需要运行 Solr 并托管供您使用。
  • 您始终可以使用Delete查询从 Solr 中删除(日期之前的所有记录)数据。

此外

  • 没有特定时间的导出或转储功能。但是,您可以每天、每周执行上述操作,您将只拥有该期间内的数据。
  • 以上所有内容都可以在 Solr 上运行而无需停机。
  • 可以使用其他 Solr 实例或Luke查询索引。
于 2012-12-26T11:50:45.740 回答