0

我运行以下查询来获取每个类别的平均喜欢

neo4j-sh (?)$ START n=node:node_auto_index(type = "U") match n-[r:likes]->()-[:mapsTo]->items return AVG(r.count) as AVGLIKES, items.name as CATEGORY;
==> +------------------------------------------------------+
==> | AVGLIKES           | CATEGORY                        |
==> +------------------------------------------------------+
==> | 7.122950819672131  | "Culture"                       |
==> | 1.3333333333333333 | "Food & Drinks"                 |
==> | 2.111111111111111  | "Albums"                        |
==> | 2.581081081081081  | "Movies"                        |
==> | 2.1                | "Musicians"                     |
==> | 7.810126582278481  | "Culture Celebs"                |
==> | 3.1206896551724137 | "TV Shows"                      |
==> | 1.0                | "Apps/Games"                    |
==> | 4.0256410256410255 | "Cars"                          | 

但是 AVG 是一个内置函数,我如何计算每个类别的标准差和其他统计摘要。我正在寻找像SQL 中的“GROUP BY”这样的东西,它将为每个类别分组所有内容,然后我可以编写一些代码或者是否有更好的方法来做到这一点。

4

1 回答 1

0

去年年底我添加了 percentile_disc、percentile_cont 聚合函数。我想他们会愿意合并标准开发的功能。理论上(我认为,我的统计数据已经生疏了),您可以根据一些百分位数样本以及平均值来计算标准偏差。那么,除了标准偏差之外,您还需要什么?

更新:我对 stdev/stdevp 聚合函数提出了拉取请求:https ://github.com/neo4j/neo4j/pull/859

于 2013-06-04T19:47:59.607 回答