这适用于 Google App Engine,但不一定受此限制。
在 Google App Engine 上,数据库不是关系型数据库,因此无法实现聚合函数(例如 sum、average 等)。每行相互独立。要计算总和和平均值,应用程序只需通过重新计算对数据库的每个新写入来摊销其计算,以便它始终是最新的。
如何计算百分位数和频率分布(即密度)?我想绘制一个值域的密度图,而这组值可能在数百万的量级。循环遍历整个数据集(每个查询的限制是返回 1000 行)并基于此进行计算可能是可行的,但我宁愿做一些聪明的方法。
是否有一些算法可以计算或近似可以在一段时间内计算的密度/频率/百分比分布?
顺便说一句,数据是不确定的,因为最大值和最小值可能无处不在。因此,分布必须采用大约 95% 的数据,并且仅基于此进行密度。