0

我在玩 Toby Segaram 的推荐代码。在这里找到,您可以尝试一下。

我注意到他的 Pearson 相关代码有些奇怪,我不确定它是 bug 还是 pearson 的自然部分。拿他的这行代码:

'Toby': {'Snakes on a Plane':4.5,'You, Me and Dupree':1.0,'Superman Returns':4.0}}

并将其更改为:

'Toby': {'Snakes on a Plane':4.0,'You, Me and Dupree':4.0,'Superman Returns':4.0}}

(即,Toby 的所有评级都是相同的。)突然之间,每一个相关性都为零,并且您没有得到任何结果。为什么会这样?

我还在玩它,所以如果没有其他人可以,我最终可能会回答我自己的问题。

更新:是不是因为 pearson 适合一条线,在这种情况下,Toby 导致这条线对每个人都是垂直的?如何解决这个问题?您是否在每个评分上都加了一点噪音?

4

1 回答 1

0

回想起来,答案其实很明显。皮尔逊相关使用一条线。但是在这种情况下,评级都是相同的,所以这条线是垂直的,这意味着它的斜率是不确定的。

这是 Pearson Correlation 的一个自然问题。我决定只使用欧几里得距离,这非常有效。

于 2020-04-26T18:24:30.670 回答