0

我们有一个 AWS Managed ES Cluster,其中有 4 个索引。直到 2019 年 12 月 31 日,我们的数据在所有索引中都存在。但是,当我们在2020 年 1 月 2 日返回时,我们看到所有索引都被删除了!这对我们来说真的很可怕。我很快做了一个 _cat/indices 的创建时间,我注意到索引.kibana_1的创建时间是格林威治标准时间 12 月 31 日上午 8:40,而一个索引的创建时间是格林威治标准时间 12 月 31 日下午 1 点。由于我们产品的摄取触发,在那之后创建了一些其他索引。

但事实并非如此,因为我们的集群是在 1-1.5 个月前托管的。我们从未停止 AWS ES 集群的启动。我们试图知道集群的正常运行时间,假设任何重启都会以任何方式影响索引,但没有找到一种方法来了解集群的正常运行时间。

我们有一个节点,当我今天运行查询时,它的正常运行时间显示为3.8d(假设 3.8 天) 。这带来了更多的混乱,因为我们的 .kibana_1 索引是在 12 月 31 日创建的,也就是差不多 5 天前。不完全确定这是否是预期的情况。

我没有在集群上启用任何访问控制,只有几个人可以访问集群,而且他们都没有在集群上运行删除请求。我们没有在 AWS 集群上启用任何日志记录。所有索引合并的总数据小于 5 GB。

我们确实恢复到了 12 月 31 日的快照。但是我们确实丢失了所有 2 天的数据。我真的很想知道在什么条件下会发生这样的事情。我们将在几周内使用整个产品进行生产,假设这会再次发生,现在让我感到害怕。

关于这是如何发生的以及如何防止它在未来发生的任何想法和想法?

4

0 回答 0