我们可以稍微改进一下。
一方面,您需要在这里至少使用一个标签,这样您就可以避免执行所有节点扫描。希望您在创建节点时使用标签。如果没有,肯定开始,未标记的节点将无法在大多数查询中使用,因为您将使用所有节点扫描。
此外,为了快速进入本地图表,一个标签s
会很有帮助,并且该标签及其label
属性上的索引(这与实际标签不同,请注意)。
接下来,如果你想确保一个节点至少有一个关系,最好使用 WHERE 而不是将它包含在匹配中。这也可以减少基数问题(例如,如果用户为不止一家公司工作),这可能会增加您的结果和后续工作量(以及丢弃查询的其他部分)。
至于如何聚合max(messages)
所有用户,您还需要聚合其他变量,这有点烦人,但没有办法解决。
此外,我更喜欢对大多数变量使用单数,并且只对集合使用复数,这有助于避免混淆。
这是一个提供更改的示例(假设 s 也是一个 :User 并且在 :User(label) 上有一个索引):
match (user:User)-[:KNOWS]->(s:User)
where s.label = "Test" and ()<-[:WORKS_FOR]-(user)
match (user)-[com:SEND]-()
with user, sum(com.count) as messages
with collect({user:user, messages:messages}) as usersInfo, 1.0 * max(messages) as total
unwind usersInfo as userInfo
return userInfo.user as user, userInfo.messages / total as percentage