我对使用 GAE 进行有效查询的数据模型建模有点陌生,但对 RDBMS 有广泛的了解。
这就是问题所在:我得到了大约一百万个术语(字符串),并且需要将关联的数值作为时间序列与每周数据点进行查询和比较。将其视为 X 轴上的时间图和显示数值度量的线性 Y 轴。
到目前为止,我在数据存储中获得了每个术语和每天的离散数据点,我正在寻找一种方法来按周聚合数据
并存储数据,以便我可以有效地查询数据存储。我正在考虑预先计算每个学期不同长度(4 周、5 周、6 周等)的时间序列,并将每个条目存储为{term, start_week, [time series]}
使用 RDBMS,我可以轻松地按周分组并以编程方式创建数据系列,无论是作为存储过程还是在应用程序后端。由于 GAE 限制和 BigTable 作为高度分布式系统的性质,这不是一个选项。
任何想法都受到高度赞赏!