0

我正在使用 CloudSearch 根据表达式的值和一些业务逻辑来索引大量需要定期更新的小型 json 数据对象(我有一个 5 分钟的 cron 作业)。

直到上周一切正常。我看到 cron 作业仍在运行,没有遇到任何错误消息,S3 中的对象仍在正确更新,但是当我执行按排名属性排序的 CloudSearch 请求时,我得到过时的搜索数据。不只是几分钟,而是几周。

我尝试重新索引,但这并没有导致任何变化。CloudSearch 是否有某种更新阈值,会阻止您在一天的请求数量达到一定数量后发布更新?我想每 5 分钟更新一次会远远低于这个数字。

我无法在 AWS 的文档中找到关于他们是否进行某种更新限制的任何迹象

4

1 回答 1

3

我最终发现是 CloudSearch 的常见问题解答中提到的:http: //aws.amazon.com/cloudsearch/faqs/

问:我可以将多少数据上传到我的搜索域?

您需要的分区数量取决于您的数据和配置,因此您可以上传的最大数据是应用搜索配置时产生 10 个搜索分区的数据集。当您超过搜索分区限制时,您的域将停止>接受上传,直到您删除文档并重新索引您的域。如果您需要超过 10 个搜索分区,请联系我们。

我从 CloudSearch 中删除了大量不再使用的数据,发现我的更新再次正常工作。我无意中遇到了 CloudSearch 索引中的数据限制。当我提交批量更新时,CloudSearch 仍然返回成功,但它默默地忽略了更新操作。

于 2014-09-08T19:18:53.583 回答