2

我正在考虑使用每日脚本来执行以下操作,以解决 ES 服务器上的更新出现问题的任何情况(我还没有高可用性设置,即便如此,它仍然可能是在 DB 和 ES 之间复制数据的情况下的良好做法)。在将这个脚本放在一起之前,我想我会检查我是否以正确的方式进行此操作,以及是否有任何我应该使用的库或技术。

该脚本将简单地从数据库中检索所有 ID,并从 ElasticSearch 中检索所有 ID,其中created_at < current_time(当前时间的快照,因为它是脚本运行时的移动目标)。然后它将根据这些 ID 集之间的差异添加和删除 Elastic 搜索。

这听起来像一个合理的方法吗?

4

2 回答 2

3

要回答我的问题,这不是最好的方法。

一种更简单但更耗费资源的方法是定期重新构建整个索引。当然,这在生产中很难做到,因为它会导致几分钟或几小时的停机时间,所以诀窍是重建一个新索引并切换到使用它。在 ElasticSearch 中,您不能重命名索引,但可以使用别名。

这里有关于方法的讨论,这里有针对轮胎用户的 rake任务

于 2012-09-19T19:54:23.807 回答
0

请看一下jdbc-river插件。这个插件相当稳定,可以用来在 ES 和数据库之间同步数据。

于 2012-08-14T14:05:31.050 回答