我将找到一个合适的函数,以便根据他们的喜好获得两个人之间的准确相似度。
例如,人与标签相连,他们对每个标签的渴望将作为数值保存在标签节点的边缘。我想向每个人推荐相似的人。
我找到了两个解决方案:
- 余弦相似度
Neo4j 中有一个余弦函数,它只接受一个输入,而在上面的函数中,我需要将向量传递给这个公式。如:
对于“a”:a=[10, 20, 45] 每个数字表示人们对每个标签的渴望。对于“b”:b=[20, 50, 70]
- 皮尔逊相关
当我在网上冲浪和您的文档时,我发现: http: //neo4j.com/docs/stable/cypher-cookbook-similarity-calc.html#cookbook-calculate-similarities-by-complex-calculations
我的问题是这个公式背后的逻辑是什么?r 和 H 有什么区别?
因为乍一看,我认为 H1 或 H2 总是等于一个。除非我应该考虑图表的其余部分。
提前感谢您的任何帮助。