0

给定一组结果,我想标准化一个值。

理想世界查询示例:

match (c)<-[:WORKS_FOR]-(u)-[:KNOWS]->(s)
where s.label = "Test"
with u as users
match (users)-[com:SEND]-(otherUsers)
with  users, sum(com.count) as messages
return users, messages / max(messages)

如何max(messages)从用户中获取?UNWIND也许?

4

1 回答 1

1

我们可以稍微改进一下。

一方面,您需要在这里至少使用一个标签,这样您就可以避免执行所有节点扫描。希望您在创建节点时使用标签。如果没有,肯定开始,未标记的节点将无法在大多数查询中使用,因为您将使用所有节点扫描。

此外,为了快速进入本地图表,一个标签s会很有帮助,并且该标签及其label属性上的索引(这与实际标签不同,请注意)。

接下来,如果你想确保一个节点至少有一个关系,最好使用 WHERE 而不是将它包含在匹配中。这也可以减少基数问题(例如,如果用户为不止一家公司工作),这可能会增加您的结果和后续工作量(以及丢弃查询的其他部分)。

至于如何聚合max(messages)所有用户,您还需要聚合其他变量,这有点烦人,但没有办法解决。

此外,我更喜欢对大多数变量使用单数,并且只对集合使用复数,这有助于避免混淆。

这是一个提供更改的示例(假设 s 也是一个 :User 并且在 :User(label) 上有一个索引):

match (user:User)-[:KNOWS]->(s:User)
where s.label = "Test" and ()<-[:WORKS_FOR]-(user)
match (user)-[com:SEND]-()
with  user, sum(com.count) as messages
with collect({user:user, messages:messages}) as usersInfo, 1.0 * max(messages) as total
unwind usersInfo as userInfo
return userInfo.user as user, userInfo.messages / total as percentage
于 2018-02-28T19:49:15.843 回答