我需要对数据集进行一些连续聚合。我正在使用应用引擎高复制数据存储。
假设我们有一个简单的对象,该对象的属性包含创建日期的字符串。还有其他与该对象关联的字段,但在此示例中并不重要。
假设我创建并存储了一些对象。以下是与每个对象关联的日期。每个对象按以下顺序存储。这些对象将在单独的事务中创建。
Obj1: 2012-11-11
Obj2: 2012-11-11
Obj3: 2012-11-12
Obj4: 2012-11-13
Obj5: 2012-11-14
这个想法是使用游标不断检查新的索引对象。将对新的索引实体进行聚合。
以下是我的问题:
1) 对象是否按顺序索引?就像 Obj4 是否可以在 Obj 1,2 和 3 之前被索引?如果我使用 ORDER BY 查询和游标继续搜索,这将是一个问题。如果索引出现延迟,将无法找到某些实体。
2) 如果没有指定 ORDER BY,查询中返回的实体是什么顺序?
3) 我将如何检查新的索引实体?如,抓取所有实体,存储光标,然后检查自上次查询以来是否有任何新实体被索引?
不那么重要,但值得深思
4)是否所有字段都被索引在一起?如,如果我有一个 date 属性,让我们说一个 name 属性,对于给定的对象,这两个属性是否会同时被索引?
5)如果在同一个事务中写入多个实体,那么事务中的所有实体是否同时被索引?
6)如果所有实体都属于同一个实体组,是否所有实体都同时被索引?
感谢您的回复。