作为后台任务,我需要按索引顺序遍历相当大的实体数据集。(实体数量约 200,000+)
我知道 TaskQueue API 以及可能的后台实例是可行的方法,但我有时会遇到 DataStoreUnavailable 和超时异常,我正在寻找的是一种使用 GAE 在后台进行迭代和更新的可靠方法蜜蜂。
了解迭代的进度对我也很有用。
我也知道实验性的 Java Map Reduce API,但在我看来,这似乎更像是一个并行处理 API,而不是有序的。(如果我错了,请纠正我。Java Map Reduce 示例目前似乎很少而且相距甚远)
有没有做这类工作的具体例子或好的模式?